使用嵌套类导出 xml 文件

Question

gfd2

Asked:2022-01-02 05:32:12 +0000 UTC2022-01-02 05:32:12 +0000 UTC 2022-01-02 05:32:12 +0000 UTC

使用htmlagilitypack解析时如何从属性“a”中获取文本与“strong”中的内容进行比较

772

<div class="blocks">
<li>...</li>
<li>...</li>
<li>
<strong>Правообладатель:</strong>
<a href="/azbuka-attikus/">Азбука-Аттикус</a>
</li>
<li>...</li>
</div>

我试过这样：

HtmlNode pravo = document.DocumentNode.SelectSingleNode("//li/strong[@text='Правообладатель:']/a");

我知道这样我将无法从a获取文本，但我不再有任何想法如何做到这一点。

1 个回答

Voted

aepot · Answer 1 · 2022-01-02T06:33:00Z

好的备忘单 - Xpath备忘单

错误消失了，但他从错误的地方取来并写了“Ickabog J.K. Rowling Table of Contents”，但应该是“Ickabog J.K. Rowling ABC-Atticus”。他从这里获取数据https://litres.ru/joan-ketlin-rouling/ikabog

你的问题是你取了inspector的代码，也就是已经被页面内嵌的javascript处理过了，但是你需要准确的取页面的源代码（页面右键-Source code），必要的其中一部分看起来像这样：

<li><strong>Правообладатель:</strong> <span data-link="/azbuka-attikus/" class="biblio_info_detailed__link biblio_book_link_js">Азбука-Аттикус</span></li>

因此，获取所需链接的完整代码将如下所示。

private static readonly HttpClient client = new HttpClient();

static async Task Main(string[] args)
{
    string html = await client.GetStringAsync("https://www.litres.ru/dzhoan-ketlin-rouling/ikabog/");
    HtmlDocument doc = new HtmlDocument();
    doc.LoadHtml(html);
    HtmlNode pravo = doc.DocumentNode.SelectSingleNode("//strong[contains(text(),'Правообладатель')]/following::span");
    Console.WriteLine(pravo.InnerText);
    Console.WriteLine(pravo.Attributes["data-link"].Value);
}

控制台输出

Азбука-Аттикус
/azbuka-attikus/

或者更容易提出请求

HtmlNode pravo = doc.DocumentNode.SelectSingleNode("//span[contains(@class,'biblio_book_link_js')]");

你也可以不使用 XPath，而是使用 CSS 选择器，为此你需要额外安装 NuGet 包Fizzler.Systems.HtmlAgilityPack，你可以这样做：

HtmlNode pravo = doc.DocumentNode.QuerySelector(".biblio_book_link_js");

使用htmlagilitypack解析时如何从属性“a”中获取文本与“strong”中的内容进行比较

表格填充不起作用

提示 50/50，有两个，其中一个是正确的

在 PyQt5 中停止进程

我的脚本不工作

在文本文件中写入和读取列表

如何像屏幕截图中那样并排排列这些块？

确定文本文件中每一行的字符数

将接口对象传递给 JAVA 构造函数

正确更新数据库中的数据

Python解析不是css

使用htmlagilitypack解析时如何从属性“a”中获取文本与“strong”中的内容进行比较

1 个回答

相关问题