有一个代码:
<div class="sm gray">
<img class="absmid" alt="Продам" src="https://vestniktm.com/images/typep.gif"> Разместили сегодня (Дата окончания публикации: 18.04.2019 г.)</div>
本质上,此文本指的是一个 div。拉出这段文字就够了:
date = html.cssselect("div.sm.gray")[0].text
但是不,它返回无。我以为它指的是 Img,只是缺少尾随 /
date = html.cssselect("div.sm.gray > img")[0]
回来:
<img class="absmid" alt="Продам" src="https://vestniktm.com/images/typep.gif"> Разместили сегодня (Дата окончания публикации: 18.04.2019 г.)
所以这是真的。我们取文:
date = html.cssselect("div.sm.gray > img")[0].text
但它也返回无。什么?
将解析器从 lxml 更改为 html.parser,但错误仍然存在
有可能是这样的: