2020年新年大赛！

Question

emokid.

Asked:2022-07-28 23:50:58 +0000 UTC2022-07-28 23:50:58 +0000 UTC 2022-07-28 23:50:58 +0000 UTC

Python解析野莓

772

我正在学习从网站收集数据。决定用野莓。我无法从网站上获取新旧价格，文件中只有 None 或 []。最有可能的问题是我选错了课，但我就是不知道该选哪门课。我参加了所有有价格的课程。这是产品的链接https://www.wildberries.ru/catalog/37115463/detail.aspx?targetUrl=GP。

import os
import requests
from bs4 import BeautifulSoup

try:
    os.mkdir(r'') # тут путь к диску
except FileExistsError:
    print('Файл уже существует') # создание папки

def infotovar(url):
    file = open("info.txt", 'w+')  # создание файла в котором будет все информация о товаре(1 фото, старая и новая цена, цвет, бренд и тип)
    pathtofile = os.path.abspath('info.txt')  # путь к файлу
    api = requests.get(url)
    result = api.content
    soup = BeautifulSoup(result, 'html.parser')
    price = soup.find('span', class_='price-block__price-wrap').get_text(strip=True)
    print(price)
    file.close()
    os.replace(pathtofile, 'C:\') # перемещение файла в папку

def main():
    infotovar('https://www.wildberries.ru/catalog/37115463/detail.aspx?targetUrl=GP')

if __name__ == "__main__":
    main()

1 个回答

Voted

Timofey · Answer 1 · 2022-07-29T00:42:41Z

Best Answer

Timofey

2022-07-29T00:42:41Z2022-07-29T00:42:41Z

Wildberries 使用客户端站点渲染，也就是说，它不会一次加载整个页面。要解析这些站点，您可以使用诸如selenium.

有关客户端和服务器站点渲染的更多信息

了解有关解析的更多信息selenium

0

Python解析野莓

我看不懂措辞

请求的模块“del”不提供名为“default”的导出

"!+tab" 在 HTML 的 vs 代码中不起作用

我正在尝试解决“猜词”的问题。Python

可以使用哪些命令将当前指针移动到指定的提交而不更改工作目录中的文件？

Python解析野莓

问题：“警告：检查最新版本的 pip 时出错。”

帮助编写一个用值填充变量的循环。解决这个问题

尽管依赖数组为空，但在渲染上调用了 2 次 useEffect

数据不通过 Telegram.WebApp.sendData 发送

Python解析野莓

1 个回答

相关问题