有包含门票主题作为第一行的文件。
接下来是门票。
我想获取每张票的内容,包括票号。
import re
from typing import List
content = """\
Тема: Бла Бла Бла
Билет №1
1. валдывлдывладвылавыл
2. ldekldkldkldkld dkfdk
3. dkjkdjksdjdsjfdsj
Билет №2
1. вwdsалдывлдывладвылавыл
2. asdladekldkldkldkld dkfdk
3. dkjkdjksdjdsjfdsj
4. ldekldkldkldkld dkfdk
Билет №3
1. sadвwdsалд ывлдывлад вылавыл
2. asdsd ladekldkldkldkld dkfdk
3. asddkjkdjk sdjdsjfdsj
4. s ldekldkldksaldkld dkfdk
5. edk jkdjksdjdsjfdsj
Билет №4
1. sdsadвwdsалд ывлдывлад вылавыл
2. Dasdsd ladekldkldkldkld dkfdk
"""
def quiz(s) -> List[str]:
regexp = re.compile(r'Билет №\d{1,3}')
return regexp.split(s)[1:]
for item in quiz(content):
print(item, end='---')
结果:
1. valdyvldyvladvyval 2.ldekldkldkldklddkfdk 3. dkjkdjksdjdsjfdsj --- 1. wdsaldyvldyvladvyval 2.asdladekldkldkldklddkfdk 3. dkjkdjksdjdsjfdsj 4.ldekldkldkldklddkfdk --- 1. sadvdsald ivldyvlad 抓获 2. asdsd ladekldkldkldkld dkfdk 3. asddkjkdjk sdjdsjfdsj 4.sldekldkldksaldklddkfdk 5. edk jkdjksdjdsjfdsj --- 1. sdsadvwdsald ivldyvlad 抓到 2. Dasdsdladekldkldkldklddkfdk ---
我想用票号获取信息,例如:
票号 3 1. sadvdsald ivldyvlad 抓获 2. asdsd ladekldkldkldkld dkfdk 3. asddkjkdjk sdjdsjfdsj 4.sldekldkldksaldklddkfdk 5. edk jkdjksdjdsjfdsj
如何使用正则表达式来实现这一点?
试试这样:
结果: