我有一个带有 html 代码的文本文件,尤其是带有 img 标签的文本文件。
所以问题是,对于 src 属性中的大多数 img 标签,没有特定的链接,而是“data: image / here_random_characters”,并且在同一个标签中,有一个属性(data-lazy)具有正确的链接。
问题:如果 src 包含数据并将相邻的 data-lazy 替换为 src,如何删除 python 中的属性?
标记示例:
<img src="data:image/ACwAABADs" data-lazy="https://mysite/imgs/img.jpg">
我希望它最终看起来如何:
<img src="https://mysite/imgs/img.jpg">
大概是这样的:
并尝试这样:
PS。
但我建议您诚实地使用解析器解析文件并更改属性: