我正在尝试解析此页面上每个广告的第一张照片:https://www.otodom.pl/pl/wyniki/wynajem/mieszkanie/cala-polska ?ownerTypeSingleSelect=ALL&viewType=listing&limit=72
然而,事实证明只解析了少数广告的图像,其余的都是使用js加载的。
在这种情况下你可以做什么和尝试?至少告诉我什么可以帮助避免使用 Selenium。
我正在尝试解析此页面上每个广告的第一张照片:https://www.otodom.pl/pl/wyniki/wynajem/mieszkanie/cala-polska ?ownerTypeSingleSelect=ALL&viewType=listing&limit=72
然而,事实证明只解析了少数广告的图像,其余的都是使用js加载的。
在这种情况下你可以做什么和尝试?至少告诉我什么可以帮助避免使用 Selenium。
最小的、可重现的示例:
在开发人员工具中,我看到正在加载json https://www.otodom.pl/_next/data/4JKqPCoRE7cVNqIQeP-Pf/pl/wyniki/wynajem/mieszkanie/cala-polska.json?ownerTypeSingleSelect=ALL&viewType=listing&limit=72&searchingCriteria =wynajem&searchingCriteria= mieszkanie&searchingCriteria=cala-polska&page=2
当尝试转到下一页时。
确实,仍然存在一些我尚未发现的挑战
你可以尝试一下beautifulSoup。
广告新闻网站上的一个人只留下了他感兴趣的新闻链接: https://habr.com/ru/articles/544828/