解析具有以下结构的html:
<div class="versions">
<div class="meld" data-versions-items="2021 г.">
<a href="https://www.englishforcing.ru/novosti/po-anglijski-v-budushhem-budut-govorit-s-
indijskim-akcentom-britanskij-lingvist/"></a>
</div>
<div class="meld" data-versions-items="2020 г.">
<a href="https://www.englishforcing.ru/novosti/po-anglijski-v-budushhem-budut-govorit-s-
indijskim-akcentom-britanskij-lingvist/"></a>
</div>
<div class="meld" data-versions-items="2019 г.">
<a href="https://www.englishforcing.ru/novosti/po-anglijski-v-budushhem-budut-govorit-s-indijskim-akcentom-britanskij-lingvist/"></a>
</div>
</div>
我想使用 XPath 在一个请求中获取 2020 年、2019 年的所有链接,假设 2021 年,不要接受它..如何从所有节点获取所需年份的链接...?像这样尝试:
$document = new DOMDocument();
$document->loadHTML($html);
$xpath = new DOMXpath($document);
$elements = $xpath->query('//div[contains(@class,"versions")]');
所以:
$document = new DOMDocument();
$document->loadHTML($html);
$xpath = new DOMXpath($document);
$experiments = $xpath->query('//div[contains(@data-versions-items,"2020 г.")]');
对于 2020 年,它提供了信息,但我想在几年内不替换周期中的几个可能选项,因为那时会有几个 xpath zarpos,这是多余的..
是否有可能达到预期的结果以及如何实现?我不知道该尝试什么了。。
对于 XPath 2.0 及更高版本。
基于序列的思想。
XPath 2.0 或更高版本
XPath 1.0