RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题 / 1503062
Accepted
shezyy
shezyy
Asked:2023-03-08 07:30:04 +0000 UTC2023-03-08 07:30:04 +0000 UTC 2023-03-08 07:30:04 +0000 UTC

程序达到最大1200局,虽然总共有7350局,定时器尝试增加,没有任何变化,但你需要把7350局全部拿走

  • 772
from selenium import webdriver, common
import time
from bs4 import BeautifulSoup
from selenium import webdriver
import time
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.by import By
import json

url = f'https://store.steampowered.com/specials/'
s = Service(executable_path='C:\Пользователи\Олег\PycharmProjects\TelegramBot\chromedriver_win32\chromedriver.exe')
options = webdriver.ChromeOptions()
driver = webdriver.Chrome(service=s, options=options)
driver.get(url)
time.sleep(3)
try:
    for i in range(650):
        driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
        time.sleep(2)
        driver.find_element(By.XPATH, '//div[@class="saleitembrowser_ShowContentsContainer_3IRkb"]//button[text()="Показать больше"]').click()
except common.exceptions.NoSuchElementException:
    pass
time.sleep(3)
html = driver.page_source
soup = BeautifulSoup(html, "lxml")
games_names = soup.find_all('div', class_='salepreviewwidgets_StoreSaleWidgetRight_1lRFu')
all_sales_dict = {}
for game in games_names:
    try:
        name = game.find('div', 'salepreviewwidgets_TitleCtn_1F4bc').find('a').text
        price_sale = game.find('div', 'salepreviewwidgets_StoreSalePriceBox_Wh0L8').text
        price_orig = game.find('div', 'salepreviewwidgets_StoreOriginalPrice_1EKGZ').text
        sale = game.find('div', 'salepreviewwidgets_StoreSaleDiscountBox_2fpFv').text
        price = (f"Цена без скидки: {price_orig}. Скидка: {sale}. Цена со скидкой: {price_sale}")
        all_sales_dict[name] = price
    except AttributeError:
        pass
with open("all_sales.json", "w", encoding="utf-8") as file:
    json.dump(all_sales_dict, file, indent=4, ensure_ascii=False)
python
  • 1 1 个回答
  • 39 Views

1 个回答

  • Voted
  1. Best Answer
    user510170
    2023-03-08T18:24:06Z2023-03-08T18:24:06Z

    看起来现在的问题是页面没有时间加载,我更改了代码并留下了评论。将数据收集传输到我们将在循环中调用的函数。在该函数中,我们将等到按钮加载完毕或 10 秒超时结束,然后按下它,收集数据并将其写入文件。不要忘记进口。重复的次数必须以帝国的方式确定,我认为5-7次就足够了。为方便起见,我还添加了循环输出,以便了解程序现在的位置,在程序完成后,我添加了收集结果数量的输出。请检查它是如何工作的,写下结果。

    ...
    from selenium.webdriver.support import expected_conditions as EC
    from selenium.webdriver.support.wait import WebDriverWait
    ...
    
    ...
        driver.get(url)
        time.sleep(3)
        count=0
        for i in range(7): # Можно увеличить счётчик на столько повторений сколько потребуется, что бы собрать все скидки
            count+=1
            print(f'Итерация N - {count}')
            try:
                f = open("all_sales.json")
                d = json.load(f)
                print('Собрано сейчас -', len(d))
            except FileNotFoundError:
                print('Собрано сейчас - 0')
                pass
            driver = try_sales(driver)
        f = open("all_sales.json")
        d = json.load(f)
        print('Сбор данных завершен, собрано -', len(d))
        
    
    
    def try_sales(driver):
        try:
            for i in range(100): # Тут тоже можно увеличить допустим до 100-200
                driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
                wait = WebDriverWait(driver, 10) # установим таймаут ожидания в 10 секунд, ниже будем ждать до появления элемента на странице или 10 секунд 
                wait.until(EC.element_to_be_clickable((By.XPATH, '//div[@class="saleitembrowser_ShowContentsContainer_3IRkb"]//button[text()="Показать больше"]')))
                driver.find_element(By.XPATH, '//div[@class="saleitembrowser_ShowContentsContainer_3IRkb"]//button[text()="Показать больше"]').click()
        except common.exceptions.NoSuchElementException:
            pass
        html = driver.page_source
        soup = BeautifulSoup(html, "lxml")
        games_names = soup.find_all('div', class_='salepreviewwidgets_StoreSaleWidgetRight_1lRFu')
        all_sales_dict = {}
        for game in games_names:
            try:
                name = game.find('div', 'salepreviewwidgets_TitleCtn_1F4bc').find('a').text
                price_sale = game.find('div', 'salepreviewwidgets_StoreSalePriceBox_Wh0L8').text
                price_orig = game.find('div', 'salepreviewwidgets_StoreOriginalPrice_1EKGZ').text
                sale = game.find('div', 'salepreviewwidgets_StoreSaleDiscountBox_2fpFv').text
                price = (f"Цена без скидки: {price_orig}. Скидка: {sale}. Цена со скидкой: {price_sale}")
                all_sales_dict[name] = price
            except AttributeError:
                pass
        with open("all_sales.json", "w", encoding="utf-8") as file:
            json.dump(all_sales_dict, file, indent=4, ensure_ascii=False)
        return driver
    ...
    
    • 1

相关问题

  • 是否可以以某种方式自定义 QTabWidget?

  • telebot.anihelper.ApiException 错误

  • Python。检查一个数字是否是 3 的幂。输出 无

  • 解析多个响应

  • 交换两个数组的元素,以便它们的新内容也反转

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    我看不懂措辞

    • 1 个回答
  • Marko Smith

    请求的模块“del”不提供名为“default”的导出

    • 3 个回答
  • Marko Smith

    "!+tab" 在 HTML 的 vs 代码中不起作用

    • 5 个回答
  • Marko Smith

    我正在尝试解决“猜词”的问题。Python

    • 2 个回答
  • Marko Smith

    可以使用哪些命令将当前指针移动到指定的提交而不更改工作目录中的文件?

    • 1 个回答
  • Marko Smith

    Python解析野莓

    • 1 个回答
  • Marko Smith

    问题:“警告:检查最新版本的 pip 时出错。”

    • 2 个回答
  • Marko Smith

    帮助编写一个用值填充变量的循环。解决这个问题

    • 2 个回答
  • Marko Smith

    尽管依赖数组为空,但在渲染上调用了 2 次 useEffect

    • 2 个回答
  • Marko Smith

    数据不通过 Telegram.WebApp.sendData 发送

    • 1 个回答
  • Martin Hope
    Alexandr_TT 2020年新年大赛! 2020-12-20 18:20:21 +0000 UTC
  • Martin Hope
    Alexandr_TT 圣诞树动画 2020-12-23 00:38:08 +0000 UTC
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5