从这里我想只取文本“空中城堡”,但在尝试解析时,它总是完全取走它,结果是“空中文本城堡”。如果用 div 和 h1 解析,还是一样的。也许您可以以某种方式例外,以便它跳过跨度。我只是不想剪掉它,因为在不同的书中,它是不同的。例如:PDF、音频、文本。我找不到。下面我将举例说明我是如何尝试这样做的,但它没有正常工作。
<div class="biblio_book_name biblio-book__title-block">
<h1 itemprop="name">Воздушный замок
<span class="label label-text">Текст</span>
</h1>
</div>
1路
HtmlNode name = document.DocumentNode.SelectSingleNode("//h1[@itemprop='name']");
2种方法
HtmlNode name = document.DocumentNode.SelectSingleNode("//div[@class='biblio_book_name biblio-book__title-block']");
必须在第一种方法的末尾写才能
/text()得到它HtmlNode name = document.DocumentNode.SelectSingleNode("//h1[@itemprop='name']/text()");