RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题 / 1192472
Accepted
Anton Charov
Anton Charov
Asked:2021-10-19 23:33:41 +0000 UTC2021-10-19 23:33:41 +0000 UTC 2021-10-19 23:33:41 +0000 UTC

如何拆分字符串?

  • 772

有一条按规则建的线。“City [synonym1, .., synonymN] {link}, City2 [] {}]” 方括号和/或大括号中可能没有文本。例子

    String input = "Москва [Мск, Белокаменная] {msk.com}, Санкт-Петербург [Спб, Питер], Ростов, Калининград [Кёниг] {123.com}";

需要一个正则表达式来分成几部分

  1. 莫斯科 [Msk, Belokamennaya] {msk.com}
  2. 圣彼得堡 [圣彼得堡、圣彼得堡]
  3. 罗斯托夫
  4. 加里宁格勒 [Koenig] {123.com}

然后你需要将每一行划分为城市、同义词和链接

  1. 莫斯科
  2. [莫斯科时间,别洛卡门纳亚]
  3. {msk.com}

据我了解,这里需要输入表格前面文本的条件"?<=\\{*\\})||(?<=[*]), ?" 告诉我如何撰写?

java
  • 2 2 个回答
  • 10 Views

2 个回答

  • Voted
  1. Best Answer
    Wiktor Stribiżew
    2021-10-20T00:25:17Z2021-10-20T00:25:17Z

    您可以使用

    "(?U)(\\w+(?:-\\w+)*)(?:\\s*(?:\\[([^\\]\\[]*)]))?(?:,?\\s*\\{([^{}]*)\\})?"
    

    查看表达式如何工作的示例。细节:

    • (?U)- Pattern.UNICODE_CHARACTER_CLASS- 包括 Unicode 支持\w
    • (\w+(?:-\w+)*)- 子模式 #1:一个或多个字母数字字符,后跟 0 个或多个字符重复-和一个或多个字母数字字符
    • (?:\s*\[([^\]\[]*)])?- 0 个或多个空白字符的可选序列,然后[是 0 个或多个除]and以外的字符[(子模式 #2),然后]
    • (?:,?\s*\{([^{}]*)\})?- 一个可选的逗号序列,0 个或多个空格字符,然后{是 0 个或多个除}and以外的字符{(子模式 #3),然后是}.

    Java代码:

    String input = "Москва [Мск, Белокаменная] {msk.com}, Санкт-Петербург [Спб, Питер], Ростов, Калининград [Кёниг] {123.com}\nРостов {123.com}";
    Pattern pattern = Pattern.compile("(?U)(\\w+(?:-\\w+)*)(?:\\s*(?:\\[([^\\]\\[]*)]))?(?:,?\\s*\\{([^{}]*)\\})?");
    Matcher matcher = pattern.matcher(input);
    while (matcher.find()){
        System.out.println("-------------\nСовпадение: " + matcher.group());
        System.out.println("Подмаска №1: " + matcher.group(1));
        if (matcher.group(2) != null) {
            System.out.println("Подмаска №2: " + matcher.group(2)); 
        }
        if (matcher.group(3) != null) {
            System.out.println("Подмаска №3: " + matcher.group(3)); 
        }
    } 
    

    结果:

    -------------
    Совпадение: Москва [Мск, Белокаменная] {msk.com}
    Подмаска №1: Москва
    Подмаска №2: Мск, Белокаменная
    Подмаска №3: msk.com
    -------------
    Совпадение: Санкт-Петербург [Спб, Питер]
    Подмаска №1: Санкт-Петербург
    Подмаска №2: Спб, Питер
    -------------
    Совпадение: Ростов
    Подмаска №1: Ростов
    -------------
    Совпадение: Калининград [Кёниг] {123.com}
    Подмаска №1: Калининград
    Подмаска №2: Кёниг
    Подмаска №3: 123.com
    -------------
    Совпадение: Ростов {123.com}
    Подмаска №1: Ростов
    Подмаска №3: 123.com
    
    • 2
  2. roddar92
    2021-10-20T00:25:41Z2021-10-20T00:25:41Z

    对于问题的第二部分,.split(" ")当您按空格分隔每个部分时,该函数适合此处。

    对于第一个任务,用逗号分隔文本是不够的,因为逗号既可以是部分的分隔符,也可以在 和 之间的枚举块{ }中[ ]。第一部分的解决方案可能如下所示:

    StringBuilder sb = new StringBuilder();
    List<String> parts = new ArrayList<>();
    int bracketsCounter = 0;
    for (int i = 0; i < input.length(); i++) {
        String symbol = String.valueOf(input.charAt(i));
        if ("({[".contains(symbol)) bracketsCounter++;
        else if (")}]".contains(symbol)) bracketsCounter--;
    
        if (symbol.equals(",") && bracketsCounter == 0) {
            if (sb.length() > 0) {
                parts.add(sb.toString());
                sb = new StringBuilder();
            }
        } else {
            sb.append(symbol);
        }
    }
    
    if (sb.length() > 0) {
        parts.add(sb.toString());
    }
    
    • 1

相关问题

  • wpcap 找不到指定的模块

  • 如何以编程方式从桌面应用程序打开 HTML 页面?

  • Android Studio 中的 R.java 文件在哪里?

  • HashMap 初始化

  • 如何使用 lambda 表达式通过增加与原点的距离来对点进行排序?

  • 最大化窗口时如何调整元素大小?

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    如何从列表中打印最大元素(str 类型)的长度?

    • 2 个回答
  • Marko Smith

    如何在 PyQT5 中清除 QFrame 的内容

    • 1 个回答
  • Marko Smith

    如何将具有特定字符的字符串拆分为两个不同的列表?

    • 2 个回答
  • Marko Smith

    导航栏活动元素

    • 1 个回答
  • Marko Smith

    是否可以将文本放入数组中?[关闭]

    • 1 个回答
  • Marko Smith

    如何一次用多个分隔符拆分字符串?

    • 1 个回答
  • Marko Smith

    如何通过 ClassPath 创建 InputStream?

    • 2 个回答
  • Marko Smith

    在一个查询中连接多个表

    • 1 个回答
  • Marko Smith

    对列表列表中的所有值求和

    • 3 个回答
  • Marko Smith

    如何对齐 string.Format 中的列?

    • 1 个回答
  • Martin Hope
    Alexandr_TT 2020年新年大赛! 2020-12-20 18:20:21 +0000 UTC
  • Martin Hope
    Alexandr_TT 圣诞树动画 2020-12-23 00:38:08 +0000 UTC
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5