我正在学习从网站收集数据。决定用野莓。我无法从网站上获取新旧价格,文件中只有 None 或 []。最有可能的问题是我选错了课,但我就是不知道该选哪门课。我参加了所有有价格的课程。这是产品的链接https://www.wildberries.ru/catalog/37115463/detail.aspx?targetUrl=GP。
import os
import requests
from bs4 import BeautifulSoup
try:
os.mkdir(r'') # тут путь к диску
except FileExistsError:
print('Файл уже существует') # создание папки
def infotovar(url):
file = open("info.txt", 'w+') # создание файла в котором будет все информация о товаре(1 фото, старая и новая цена, цвет, бренд и тип)
pathtofile = os.path.abspath('info.txt') # путь к файлу
api = requests.get(url)
result = api.content
soup = BeautifulSoup(result, 'html.parser')
price = soup.find('span', class_='price-block__price-wrap').get_text(strip=True)
print(price)
file.close()
os.replace(pathtofile, 'C:\') # перемещение файла в папку
def main():
infotovar('https://www.wildberries.ru/catalog/37115463/detail.aspx?targetUrl=GP')
if __name__ == "__main__":
main()
Wildberries 使用客户端站点渲染,也就是说,它不会一次加载整个页面。要解析这些站点,您可以使用诸如
selenium
.有关客户端和服务器站点渲染的更多信息
了解有关解析的更多信息
selenium