下面的代码显示了我如何从标签中提取电影链接的示例。
func (movie Movie) GettingData() {
document := GetMarkupDoc(settings.IviAddress + "movies")
link, _ := document.Find(".nbl-slimPosterBlock").First().Attr("href")
fmt.Println(link)
Вовзращает:
C:\Go\src\Caretaker\processing>processing.exe
/watch/437652
我需要得到最后一个字符 / 之后的内容,即 437652。我尝试使用 regexp,但不知何故,我没有找到一种方法来使用正则表达式将字符串剪切成我需要的内容。也在这里:
image, _ := document.Find(".image").First().Attr("style")
这里,图片路径是从 style 属性中解析出来的。在出口处:
background-image: url(https://адрес);
请告诉我,使用哪个库以及如何提取这些命运多舛的数据?
如果此数据相对“无聊”且单调,就像您的情况一样,则不需要正则表达式:
第二个可以优化,但这留作作业:-)。
如果数据更复杂,尤其是在 CSS中,您将至少需要一个 CSS标记器,最多需要一个解析器。
这是正则表达式:
测试https://regexr.com/5bad6