2020年新年大赛！

Question

Alexsey Kr

Asked:2020-08-20 19:20:22 +0000 UTC2020-08-20 19:20:22 +0000 UTC 2020-08-20 19:20:22 +0000 UTC

Python解析器

772

import requests
from lxml import html


response = requests.get('https://www.youtube.com/results?search_query=gorrilaz&sp=CAE%253D')
parser_tree = html.fromstring(response.content)
content = parser_tree.xpath('//*[contains(@class, "yt-lockup-thumbnail")]/a[@href]')

print(content)
print(type(content[0]))

我正在尝试获取页面上的所有链接。答案为何而来

"元素 a 位于 0x7ff2295f80e8">

?

1 个回答

Voted

Andrey · Answer 1 · 2020-08-20T20:18:35Z

Best Answer

Andrey

2020-08-20T20:18:35Z2020-08-20T20:18:35Z

在变量中content你有类对象lxml.html.HtmlElement为了拉出链接，我们可以get('href')在每个这样的元素上调用一个方法：

In [5]: type(content[0])
Out[5]: lxml.html.HtmlElement

In [6]: links = [el.get('href') for el in content]

In [7]: links
Out[7]: 
['/watch?v=CJV08IuDtG8',
 '/watch?v=gMAGskTN9SM',
 '/watch?v=_pr0kBvbuNc',
 '/watch?v=7tsPhlmnsuQ',
 '/watch?v=pM7_UnguPp0',
 '/watch?v=nP6qhrdfTjs',
 '/watch?v=DH6EYKihEd4',
 '/watch?v=JChkWu6XLjI',
 '/watch?v=qolRTEITF6s',
 '/watch?v=qH7y8yQ48dg',
 '/watch?v=8VYLHwxd-e0',
 '/watch?v=5LrAW-roUWk',
 '/watch?v=D4vEtnOIqNs',
 '/watch?v=3Scp7rlqQ2Y',
 '/watch?v=ZAFJSbduMqg',
 '/watch?v=FolC7vZl4G4',
 '/watch?v=JF4Cujp52Qc',
 '/watch?v=iUHVHILLTyo',
 '/watch?v=83FdYHkPNC0',
 '/watch?v=c72k6n0q13o']

0

Python解析器

根据浏览器窗口的大小调整背景图案的大小

理解for循环的执行逻辑

复制动态数组时出错（C++）

Or and If,elif,else 构造[重复]

如何构建支持 x64 的 APK

如何使按钮的输入宽度？

如何显示对象变量的名称？

如何循环一个函数？

LOWORD 宏有什么作用？

从字符串的开头删除直到并包括一个字符

Python解析器

1 个回答

相关问题