2020年新年大赛！

Question

Senseless

Asked:2020-01-28 03:10:59 +0000 UTC2020-01-28 03:10:59 +0000 UTC 2020-01-28 03:10:59 +0000 UTC

如何使用 XPath 获取我们当前使用的站点的域？

772

第一个问题： 在页面 https://ru.wikipedia.org/wiki/XPath上，获取我们当前所在站点的域。

使用 XPath 查询（谷歌浏览器开发工具中的 f12 和 ctrl+f）。

问题是怎么做？应该是什么要求？

第二个问题： 在页面 https://www.google.com/search?q=xpath上，收集除第一个和最后一个以外的所有奇怪搜索结果的链接。

问题是怎么做？应该是什么要求？

1 个回答

Voted

MarshallBanana · Answer 1 · 2020-02-03T19:18:48Z

Best Answer

MarshallBanana

2020-02-03T19:18:48Z2020-02-03T19:18:48Z

1) 站点域 - ru.wikipedia.org。如果我们在开发者控制台的 html 中搜索这个字符串，我们将得到 15 个匹配项。带有 rel='canonical' 属性的链接标签包含指向页面本身的链接，并且位于每个 Wikipedia 页面上。从此字符串中，使用 substring 函数，您可以提取域：

substring((//link[@rel='canonical']/@href),9,16)

2）我们得到搜索结果的所有链接，然后我们写条件。重要的是要记住，这种情况下的条件应该写到已经准备好的查询结果中，即在括号 - (query)[conditions] 之后。

(//div[@class='r']/a/@href)[position() mod 2 > 0 and position() > 1 and position() < last()]

0

如何使用 XPath 获取我们当前使用的站点的域？

如何从列表中打印最大元素（str 类型）的长度？

如何在 PyQT5 中清除 QFrame 的内容

如何将具有特定字符的字符串拆分为两个不同的列表？

导航栏活动元素

是否可以将文本放入数组中？[关闭]

如何一次用多个分隔符拆分字符串？

如何通过 ClassPath 创建 InputStream？

在一个查询中连接多个表

对列表列表中的所有值求和

如何对齐 string.Format 中的列？

如何使用 XPath 获取我们当前使用的站点的域？

1 个回答

相关问题