有一个链接列表:
a = ['abc.ru/v2', 'abc.com/er.tyre.6/title/86348', 'abc.com/test/ertg.yeg/title/86348', 'bcd.ru/467', 'abc.com/feed?app_id=57655'
如何使用正则表达式从此列表中仅提取这些链接:
['abc.com/er.tyre.6/title/86348', 'abc.com/test/ertg.yeg/title/86348']
到目前为止,正则表达式只有一部分,也许可以通过某种方式补充:
r'''(?:abc\.com\/)(title/\d{5})'''
例如,使用这样的模式
abc\.com/.+/title/\d{5}
(如果数字中没有 5 位数字abc\.com/.+/title/\d+
:)