2020年新年大赛！

Question

Artyom Lazovikov

Asked:2020-02-03 21:48:05 +0000 UTC2020-02-03 21:48:05 +0000 UTC 2020-02-03 21:48:05 +0000 UTC

复杂的线分割

772

有这样一行——

str = 'a, b, c, d, "e, f, g"'

底线是你需要用逗号分割这个字符串，但不要分割双引号内的元素。

获取内容的示例：

['a', 'b', 'c', 'd', "e, f, g"]

这是代码，但它不保留顺序，因此使用不合适

4 个回答

Voted

gil9red · Answer 1 · 2020-02-03T21:58:29Z

Best Answer

gil9red

2020-02-03T21:58:29Z2020-02-03T21:58:29Z

您可以尝试通过tokenize 处理字符串。

例子：

import io
import tokenize as T
from operator import itemgetter


def tokenize_string(data):
    tokens = T.tokenize(io.BytesIO(data.strip().encode()).readline)
    next(tokens)  # skip encoding token
    return list(filter(None, map(itemgetter(1), tokens)))  # filter ENDMARKER


text = 'a, b, c, d, "e, f, g"'

tokens = [x for x in tokenize_string(text) if x != ',']
print(tokens)
# ['a', 'b', 'c', 'd', '"e, f, g"']

UPD。

强制从字符串中删除引号：

tokens = [x[1:-1] if x.startswith('"') and x.endswith('"') else x for x in tokenize_string(text) if x != ',']
print(tokens)
# ['a', 'b', 'c', 'd', 'e, f, g']

5

n1tr0xs · Answer 2 · 2020-02-03T22:47:05Z

n1tr0xs

2020-02-03T22:47:05Z2020-02-03T22:47:05Z

我可以建议这种“笨拙”的方法

string = 'a, b, c, d, "e, f, g", 1, 2, 3, "5, 9, 0"'
index=0
max_index=len(string)
result=[]
while index < max_index:
    if string[0]==' ':
        string=string[1:]
    elif string[index]==',':
        result.append(string[:index])
        string=string[index+1:]
        max_index=len(string)
        index=0
    elif string[index]=='"':
        result.append(string[index:string[index+1:].find('"')+3])
        string=string[string[index+1:].find('"')+4:]
        max_index=len(string)
        index=0
    else:
        index+=1

print(result)
# ['a', 'b', 'c', 'd', '"e, f, g",', '1', '2', '3', '"5, 9, 0"']

2

Eugene Dennis · Answer 3 · 2020-02-03T23:45:41Z

您可以用单个元素替换组成元素（以导致一般情况），然后执行必要的操作 - split，然后将组成部分从字典中返回到它的位置

import re
t = 'a, b, c, d, "e, g, h", k'
# находим с помощью регулярных выражений составные элементы
x = re.findall('"[^\"]*"', t)
# объявляем словарик
d = dict()
# пробегаемся по списку наших составных элементов ['"e, g, h"']
# в n - у нас индекс элемента, в xx - сам элемент
for n, xx in enumerate(x):
    # придумываем псевдоним для составного элемента на основе индекса
    q = '@{}'.format(n)
    # добавляем в словарь выходное значение составного элемента
    d[q] = xx.replace('"', '')
    # заменяем составной элемент на псевдоним
    t = t.replace(xx, q)
# здесь 2 цикла, в первом текст t, который стал выглядеть вот так:
# 'a, b, c, d, @0, k' подвергаем split(','), а затем к каждому элементу
# применяем strip (s.strip())
# во втором цикле пробегаемся по всем элементам и если элемент (g) является 
# ключом словаря (g in d) то заменяем его значением из словаря
tt = [d[g] if g in d else g for g in [s.strip() for s in t.split(',')]]
# ['a', 'b', 'c', 'd', 'e, g, h', 'k']

Artyom Lazovikov · Answer 4 · 2020-02-05T20:35:55Z

我的决定。适用于任意数量的双引号元素和任意数量的双引号元素。

def _recursive_filter(line, result=None):
    try:
        if not result:
            result = []
        line = line.strip()
        if line.startswith('"'):
            temp = ''
            i = 0
            while line[i+1] != '"':
                temp += line[i]
                i += 1
            else:
                temp += f'{line[i]}"'
                result.append(temp)
                line = line[len(temp):].strip(', ')
                _recursive_filter(line, result)
        else:
            temp = ''
            i = 0
            while line[i] != ',':
                temp += line[i]
                i += 1
            else:
                temp += ','
                result.append(temp)
                line = line[len(temp):]
                _recursive_filter(line, result)
        return [x.strip(', "') for x in result]
    except IndexError:
        if temp:
            result.append(temp)

if __name__ == "__main__":
    print(_recursive_filter('"d, e, f", g, h,'))

复杂的线分割

如何从列表中打印最大元素（str 类型）的长度？

如何在 PyQT5 中清除 QFrame 的内容

如何将具有特定字符的字符串拆分为两个不同的列表？

导航栏活动元素

是否可以将文本放入数组中？[关闭]

如何一次用多个分隔符拆分字符串？

如何通过 ClassPath 创建 InputStream？

在一个查询中连接多个表

对列表列表中的所有值求和

如何对齐 string.Format 中的列？

复杂的线分割

4 个回答

相关问题