2020年新年大赛！

Question

betepok

Asked:2022-07-10 16:17:38 +0000 UTC2022-07-10 16:17:38 +0000 UTC 2022-07-10 16:17:38 +0000 UTC

解析方括号和正则括号中的文本

772

任务是显示来自这样一个字符串的文本 - “[text1] (text2)”。由于段落中有许多这样的行，因此问题变得复杂。下面是我要解析的内容和输出应该是什么的示例。

['string1'] ('text1')

['string2'] ('text2')

['string3'] ('text3')

我想在输出的哪里获得表单的多维列表

parsed = ['строка1', 'текст1'], ['строка2', 'текст2'], ['строка3','текст3']

4 个回答

Voted

KoVadim · Answer 1 · 2022-07-10T17:37:40Z

也许像这样的地方

#!/usr/bin/python3
import re

# здесь спрятана вся магия. Не пытайтесь это прочитать, можно что то вызывать
regex = r"(\['([^]]+)'\]|\('([^)]+)'\))"
r = []
f = open("data.txt")
# читаем файл построчно
for l in f:
    # тут будет улов с текущей строки
    sb = []
    matches = re.findall(regex, l)
    # если ничего не нашли - то и делать нечего
    if len(matches) == 0:
        continue
    # по всем найденным кусочкам смотрим
    for x in matches:
        # у нас там два варианта, поэтому проверяем, где зарылся бегемот
        if (x[1] == ''):
            sb.append(x[2])
        else:
            sb.append(x[1])
    # и добавляем найденный массив в больший
    r.append(sb)
# осталось по мелочам - распечатать это все дело.
print(r)

如果文件的行只包含示例中指示的选项（每行有两行），那么一切都可以大大简化

#!/usr/bin/python3
import re

regex = r"(\['([^]]+)'\]\s*\('([^)]+)'\))"
r = []
f = open("data.txt")
for l in f:
    matches = re.findall(regex, l)
    if len(matches) == 0 or len(matches[0]) != 3:
        continue
    r.append([matches[0][1], matches[0][2]])
print(r)

有些人可能会建议使用“pythonic-way”，但它对“一次性任务”有好处。

Andy Pavlov · Answer 2 · 2022-07-10T20:09:59Z

Andy Pavlov

2022-07-10T20:09:59Z2022-07-10T20:09:59Z

KoVadim上面有一些复杂的答案。在我看来，解析起来可能会更容易一些。

import re

text = """['строка1'] ('текст1')
['строка2'] ('текст2')
['строка3'] ('текст3')"""

parsed = list(map(list, re.findall("\['(\w+)'\]\s+\('(\w+)'\)", text)))

1

Namerek · Answer 3 · 2022-07-10T22:16:21Z

Namerek

2022-07-10T22:16:21Z2022-07-10T22:16:21Z

import re
txt = """['строка1'] ('текст1')
['строка2'] ('текст2')
['строка3'] ('текст3')"""

data = re.findall(r"(?<=[\[(]').+?(?='[)\]])", txt, flags=re.S)
print(
    *map(list, zip(data[::2], data[1::2]))
)
# ['строка1', 'текст1'] ['строка2', 'текст2'] ['строка3', 'текст3']

print(
    list(map(list, zip(data[::2], data[1::2])))
)
# [['строка1', 'текст1'], ['строка2', 'текст2'], ['строка3', 'текст3']]

print(
    dict(zip(data[::2], data[1::2]))
)
# {'строка1': 'текст1', 'строка2': 'текст2', 'строка3': 'текст3'}

1

Kuchizu · Answer 4 · 2022-07-11T00:46:02Z

Kuchizu

2022-07-11T00:46:02Z2022-07-11T00:46:02Z

简单的方法

s = '''\
['строка1'] ('текст1')

['строка2'] ('текст2')

['строка3'] ('текст3')
'''

l = [[eval(i.split()[0])[0], eval(i.split()[1])] for i in s.split('\n') if i]
print(l)

# [['строка1', 'текст1'], ['строка2', 'текст2'], ['строка3', 'текст3']]

1

解析方括号和正则括号中的文本

我看不懂措辞

请求的模块“del”不提供名为“default”的导出

"!+tab" 在 HTML 的 vs 代码中不起作用

我正在尝试解决“猜词”的问题。Python

可以使用哪些命令将当前指针移动到指定的提交而不更改工作目录中的文件？

Python解析野莓

问题：“警告：检查最新版本的 pip 时出错。”

帮助编写一个用值填充变量的循环。解决这个问题

尽管依赖数组为空，但在渲染上调用了 2 次 useEffect

数据不通过 Telegram.WebApp.sendData 发送

解析方括号和正则括号中的文本

4 个回答

相关问题