使用嵌套类导出 xml 文件

Question

gfd2

Asked:2022-01-02 02:16:27 +0000 UTC2022-01-02 02:16:27 +0000 UTC 2022-01-02 02:16:27 +0000 UTC

使用htmlagilitypack c#解析网站时的额外文本

772

从这里我想只取文本“空中城堡”，但在尝试解析时，它总是完全取走它，结果是“空中文本城堡”。如果用 div 和 h1 解析，还是一样的。也许您可以以某种方式例外，以便它跳过跨度。我只是不想剪掉它，因为在不同的书中，它是不同的。例如：PDF、音频、文本。我找不到。下面我将举例说明我是如何尝试这样做的，但它没有正常工作。

<div class="biblio_book_name biblio-book__title-block">
<h1 itemprop="name">Воздушный замок
<span class="label label-text">Текст</span>
</h1>
</div>

1路

HtmlNode name = document.DocumentNode.SelectSingleNode("//h1[@itemprop='name']");

2种方法

HtmlNode name = document.DocumentNode.SelectSingleNode("//div[@class='biblio_book_name biblio-book__title-block']");

1 个回答

Voted

gfd2 · Answer 1 · 2022-01-02T02:40:33Z

Best Answer

gfd2

2022-01-02T02:40:33Z2022-01-02T02:40:33Z

必须在第一种方法的末尾写才能/text()得到它HtmlNode name = document.DocumentNode.SelectSingleNode("//h1[@itemprop='name']/text()");

1

使用htmlagilitypack c#解析网站时的额外文本

表格填充不起作用

提示 50/50，有两个，其中一个是正确的

在 PyQt5 中停止进程

我的脚本不工作

在文本文件中写入和读取列表

如何像屏幕截图中那样并排排列这些块？

确定文本文件中每一行的字符数

将接口对象传递给 JAVA 构造函数

正确更新数据库中的数据

Python解析不是css

使用htmlagilitypack c#解析网站时的额外文本

1 个回答

相关问题