RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题 / 1273145
Accepted
MaxU - stop genocide of UA
MaxU - stop genocide of UA
Asked:2022-04-22 02:20:44 +0000 UTC2022-04-22 02:20:44 +0000 UTC 2022-04-22 02:20:44 +0000 UTC

如何编写正则表达式以使用 regexp_substr() 从类似 CSV 的字符串中提取第 N 个值

  • 772

如何扩展以下正则表达式(在 POSIX 标准中)以使值,, ;, /, , 即 逗号、分号、斜杠、空格和制表符的组合。

初始数据示例:

ID  EMAIL
--  --------------------------------------------------
1   NULL
2   mail1@domain.com
3   mail1@domain.com; mail2@domain.com, mail3@mail.com
4   mail1@domain.com, mail2@domain.com
5   mail1@domain.com mail2@domain.com

在 这封DB Fiddle邮件中,我尝试从每一行中提取第二封电子邮件,并希望得到以下结果(输出数据集):

ID  EMAIL
--  --------------------------------------------------
1   NULL
2   NULL
3   mail2@domain.com
4   mail2@domain.com
5   mail2@domain.com

那些。结果不应该包含分隔符:,, ;, /, 我尝试添加一个 POSIX 值[:space:]来处理空格和制表符,但结果是错误的:

select
  id,
  regexp_substr (email, '(.*?)(([[:space:],;/])|($))', 1, 2, null, 1) as second_email
from tab;

ID  EMAIL
--  --------------------------------------------------
1   NULL
2   NULL
3   NULL
4   NULL
5   mail2@domain.com

请告诉我如何修复 POSIX RegEx。

注意:我正在使用 Oracle 12.2,它不理解 RegEx 字符\s,所以我只需要使用 POSIX 标准支持的正则表达式。

PS 在这个例子中,我总是从字符串中提取第二个值——这是一个简化的(最小可重现的)例子。事实上,这是函数的一部分,它应该能够提取任何第 N 个值(N它将作为参数传递给函数)。

sql
  • 3 3 个回答
  • 10 Views

3 个回答

  • Voted
  1. 0xdb
    2022-04-22T03:47:20Z2022-04-22T03:47:20Z

    看起来以下正则表达式有效:

    select id, regexp_substr (
        email, '(\w.*?)(([[:space:],;/])|($))', 1, 2, null, 1) as second_email
    from tab
    /
    select id, regexp_substr (
        email, '(.*?)(([[:space:],;/]+)|($))', 1, 2, null, 1) as second_email
    from tab
    

    两个输出:

            ID SECOND_EMAIL                                      
    ---------- --------------------------------------------------
             1                                                   
             2                                                   
             3 mail2@domain.com                                  
             4 mail2@domain.com                                  
    
    • 4
  2. Akina
    2022-04-22T03:13:01Z2022-04-22T03:13:01Z
    SELECT tab.id, jsontable.email_num, jsontable.email
    FROM tab
    CROSS JOIN JSON_TABLE('["' || REGEXP_REPLACE(tab.email, '[,;\/ ]+', '","') || '"]',
                          '$[*]' COLUMNS (email_num FOR ORDINALITY,
                                          email VARCHAR(255) PATH '$')) jsontable;
    

    https://dbfiddle.uk/?rdbms=oracle_18&fiddle=182ab5331fc09c25ab534002c56c634f

    • 3
  3. Best Answer
    Wiktor Stribiżew
    2022-04-22T04:18:35Z2022-04-22T04:18:35Z

    正则表达式(.*?)(([[:space:],;/])|($))并不总能找到所需的匹配项,因为它(.*?)还会找到一个空字符串,并且在您的行中,分隔符旁边有空白字符,[[:space:],;/]它会找到它们。换句话说,它(.*?)捕获一个空字符串,而不是所需的值,[[:space:],;/]在例如逗号之后找到一个空格,然后返回一个匹配项。

    因此,(.*?)您需要替换这样的模板,以便它找不到空字符串,例如

    '([^[:space:]].*?)((' || '[[:space:],;/]' || ')|($))'
    

    (我对所有子模式都使用了原始语法,但我不确定这里是否需要它们。)

    该模式([^[:space:]].*?)将找不到空字符串,因为它[^[:space:]]需要除空格之外的任何一个字符,并且匹配将从该字符开始。

    • 3

相关问题

  • 通过 OUT 参数从过程结果输出

  • ON 关键字附近的语法错误 - SQL

  • 多表查询中的 Count() 聚合函数

  • 根据时间更改单元格中的日期

  • phpMyAdmin 中的错误 #1064 SQL 查询

  • Qt:包含变量的数据库查询

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    表格填充不起作用

    • 2 个回答
  • Marko Smith

    提示 50/50,有两个,其中一个是正确的

    • 1 个回答
  • Marko Smith

    在 PyQt5 中停止进程

    • 1 个回答
  • Marko Smith

    我的脚本不工作

    • 1 个回答
  • Marko Smith

    在文本文件中写入和读取列表

    • 2 个回答
  • Marko Smith

    如何像屏幕截图中那样并排排列这些块?

    • 1 个回答
  • Marko Smith

    确定文本文件中每一行的字符数

    • 2 个回答
  • Marko Smith

    将接口对象传递给 JAVA 构造函数

    • 1 个回答
  • Marko Smith

    正确更新数据库中的数据

    • 1 个回答
  • Marko Smith

    Python解析不是css

    • 1 个回答
  • Martin Hope
    Alexandr_TT 2020年新年大赛! 2020-12-20 18:20:21 +0000 UTC
  • Martin Hope
    Alexandr_TT 圣诞树动画 2020-12-23 00:38:08 +0000 UTC
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5