RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题 / 747568
Accepted
Anatol
Anatol
Asked:2020-11-21 18:13:43 +0000 UTC2020-11-21 18:13:43 +0000 UTC 2020-11-21 18:13:43 +0000 UTC

修复常规赛

  • 772

我以前没有参加过常规赛,这是练习和学习的好榜样。有一段文字:

№   Вопрос  Ответ   
1   Дата звонка     08.08.2014   
2   Время звонка    16:30  
3   Имя оператора   Иванов Иван  
4   Номер телефона абонента     84957777777  
5   Кто звонит   
6   Номер карты  
7   Препарат  
8   Телефон  
9   Комментарий     тест звонок   

可以说,它有3 列——数字、特征和值,它们由制表符分隔,但前面也可能没有 3 列,分别是制表符。我们需要一个正则表达式来提取所有这些列的值。

有这样一个选项:

var TdPattern = new Regex(
            @"^ \s* (\d+) \s* \t ([^\t]+) \t \s* ([^\t]*) \s* $",
            RegexOptions.Compiled | RegexOptions.IgnorePatternWhitespace | RegexOptions.Multiline);   

它可以工作,但如果在 2 个“列”之后没有选项卡,则会产生不正确的结果。

c#
  • 3 3 个回答
  • 10 Views

3 个回答

  • Voted
  1. Андрей NOP
    2020-11-21T19:02:39Z2020-11-21T19:02:39Z

    逐行读取文件并使用通常string.Split()的 ,例如:

    class Data
    {
        public string Num { get; set; }
        public string Question { get; set; }
        public string Answer { get; set; }
    
        public static Data Parse(string s)
        {
            var parts = s.Split('\t');
            var data = new Data { Num = parts[0] };
            if (parts.Length > 1) data.Question = parts[1];
            if (parts.Length > 2) data.Answer = parts[2];
            return data;
        }
    }
    

    然后下载将如下所示:

    List<Data> list = File.ReadLines("путь к файлу")
                          .Select(Data.Parse)
                          .ToList();
    

    如果数据不在文件中,而是在字符串变量中,则先用换行符分割:

    List<Data> list = text.Split(new[] { "\r\n" }, StringSplitOptions.None)
                          .Select(Data.Parse)
                          .ToList();
    

    选择适当的换行符,也许它对你来说就足够了,'\n'或者'\r'

    如果可能遇到空行,您可以使用该选项跳过它们StringSplitOptions.RemoveEmptyEntries

    • 5
  2. Best Answer
    Wiktor Stribiżew
    2020-11-23T18:02:44Z2020-11-23T18:02:44Z

    安德烈的答案是应该在现实生活中使用的解决方案,当可以访问代码时,以“纯程序化”的方式解决问题。

    用于在多行文本中查找行的正则表达式(带有换行符)必须用“anchors”(锚点)^(行首/LF 之后的位置,\n)和$(行尾/LF 之前的位置,\n) 带有修饰符RegexOptions.Multiline. 列之间的空格可以用\p{Zs}*, \p{Zs}- 除制表符之外的任何水平空格。如果您使用\s,那么您可能会无意中捕获下一行的一部分。\t找到一个制表符,并在一行上找到一列的值 - 使用[^\r\n\t]+/ [^\r\n\t]*,即 CR(ASCII 代码 13)、LF(ASCII 代码 10)和 TAB(ASCII 代码 9)以外的 1+/0+ 个字符。To 在多行模式下(使用RegexOptions.Multiline)绑定$发现以 CRLF 结尾的行尾必须加\r?在$.

    ?要声明一个可选的、可选的字符序列,您需要使用带有:量词的子模式(非或捕获,取决于我们是否希望稍后获取所有捕获的子字符串)(?:...)?。那些。当一行可能有也可能没有一列时,它可以声明为(?:\p{Zs}*\t\p{Zs}*[^\r\n\t]+)?. 由于它是?“贪婪的”,引擎将至少尝试在子模式中查找模式序列一次。如果没有找到,它将检查此可选组(如果有)之后的模板。

    表达式如下所示:

    (?m)^\p{Zs}*(\d+)\p{Zs}*\t\p{Zs}*([^\r\n\t]+)(?:\t\p{Zs}*([^\r\n\t]*)\p{Zs}*)?\r?$
    

    为了不混淆正则表达式的结构,您可以声明两个变量(分隔符和列模式)并在构建表达式时使用它们。

    在线查看演示:

    var tekst = "№\tВопрос\tОтвет   \n1 \tДата звонка \t08.08.2014   \n2 \tВремя звонка \t16:30  \n3 \tИмя оператора \tИванов Иван  \n4 \tНомер телефона абонента \t84957777777  \n5 \tКто звонит   \n6 \tНомер карты  \n7 \tПрепарат  \n8 \tТелефон  \n9 \tКомментарий     тест звонок   ";
    var s = @"\p{Zs}*";
    var z = @"[^\r\n\t]+";
    var TdPattern = new Regex(
        $@"^{s}(\d+){s}\t{s}({z})(?:\t{s}({z}){s})?\r?$", // ^\p{Zs}*(\d+)\p{Zs}*\t\p{Zs}*([^\r\n\t]+)(?:\t\p{Zs}*([^\r\n\t]*)\p{Zs}*)?\r?$
        RegexOptions.Compiled | RegexOptions.IgnorePatternWhitespace | RegexOptions.Multiline);  
    var result = TdPattern.Matches(tekst);
    foreach (Match m in result) {
        Console.WriteLine(m.Groups[1].Value);
        Console.WriteLine(m.Groups[2].Value);
        if (m.Groups[3].Success) Console.WriteLine(m.Groups[3].Value);
        Console.WriteLine("---------------");
    }
    

    结果:

    1
    Дата звонка 
    08.08.2014   
    ---------------
    2
    Время звонка 
    16:30  
    ---------------
    3
    Имя оператора 
    Иванов Иван  
    ---------------
    4
    Номер телефона абонента 
    84957777777  
    ---------------
    5
    Кто звонит   
    ---------------
    6
    Номер карты  
    ---------------
    7
    Препарат  
    ---------------
    8
    Телефон  
    ---------------
    9
    Комментарий 
    тест звонок   
    ---------------
    
    • 2
  3. Alex Chermenin
    2020-11-21T18:28:49Z2020-11-21T18:28:49Z

    如果列确实是制表符分隔而不是空格分隔,那么以下正则表达式将有所帮助:^(\d+)\t(.*?)(?:\t(.*))?$

    如果列由多个空格分隔,那么您可以尝试以下操作:^(\d+)\s\s+(.*?)(?:\s[^\S\n]+(.*))?$

    • 1

相关问题

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    Python 3.6 - 安装 MySQL (Windows)

    • 1 个回答
  • Marko Smith

    C++ 编写程序“计算单个岛屿”。填充一个二维数组 12x12 0 和 1

    • 2 个回答
  • Marko Smith

    返回指针的函数

    • 1 个回答
  • Marko Smith

    我使用 django 管理面板添加图像,但它没有显示

    • 1 个回答
  • Marko Smith

    这些条目是什么意思,它们的完整等效项是什么样的

    • 2 个回答
  • Marko Smith

    浏览器仍然缓存文件数据

    • 1 个回答
  • Marko Smith

    在 Excel VBA 中激活工作表的问题

    • 3 个回答
  • Marko Smith

    为什么内置类型中包含复数而小数不包含?

    • 2 个回答
  • Marko Smith

    获得唯一途径

    • 3 个回答
  • Marko Smith

    告诉我一个像幻灯片一样创建滚动的库

    • 1 个回答
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Алексей Шиманский 如何以及通过什么方式来查找 Javascript 代码中的错误? 2020-08-03 00:21:37 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    user207618 Codegolf——组合选择算法的实现 2020-10-23 18:46:29 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5