是否可以以某种方式自定义 QTabWidget？

Question

Lev145

Asked:2020-03-26 14:30:31 +0000 UTC2020-03-26 14:30:31 +0000 UTC 2020-03-26 14:30:31 +0000 UTC

解析只产生一张图像

772

这是代码python：

import requests
from bs4 import BeautifulSoup

# переменная показывающая номер домена
a = 0

def parse_img(g):
    for i in range(g):
        global a
        a += 1
        url = 'https://www.1zoom.ru/%D0%96%D0%B8%D0%B2%D0%BE%D1%82%D0%BD%D1%8B%D0%B5/%D0%9A%D0%BE%D1%82%D1%8F%D1%82%D0%B0/t2/'
        HEADERS = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36'}

        html = requests.get(url + str(a), headers = HEADERS )
        print(html.url)
        html = html.text
        soup = BeautifulSoup(html, 'lxml')

        div_tags = soup.find_all('div', {'id': 'suda'})
        
        img_tags = [div.find('img') for div in div_tags]

        url_img = [img['src'] for img in img_tags]
        return url_img
    
# Парсинг первого домена
print(parse_img(1))

结果，仅从站点解析了一张图像，而不是站点上的所有图像

结论：

https://www.1zoom.ru/%D0%96%D0%B8%D0%B2%D0%BE%D1%82%D0%BD%D1%8B%D0%B5/%D0%9A%D0%BE%D1%82%D1%8F%D1%82%D0%B0/t2/1/
['https://s1.1zoom.ru/prev2/581/Ginger_color_Cute_Kittens_580356_300x214.jpg']

我有一个问题，如何解析站点域中的所有图像，而不仅仅是一个？

1 个回答

Voted

gil9red · Answer 1 · 2020-03-26T20:19:33Z

重写解析器：

使用“开箱即用”的解析器：html.parser
通过 css 选择器完成图像搜索
#suda- 搜索一个元素id="suda"
.ph- 元素与class="ph"
>表示右边的元素是左边元素的直接子元素。那些。.ph > a表示该类的元素ph有一个嵌套元素<a>
img[src]–<img>将具有属性的搜索src
小重构

示例：

import requests
from bs4 import BeautifulSoup

def get_imgs(page: int) -> list:
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36'
    }
    url = f'https://www.1zoom.ru/Животные/Котята/t2/{page}'

    rs = requests.get(url, headers=headers)
    root = BeautifulSoup(rs.content, 'html.parser')

    return [img['src'] for img in root.select('#suda .ph > a > img[src]')]

# Парсинг первой страницы
imgs = get_imgs(1)
print(len(imgs), imgs)
# 30 ['https://s1.1zoom.ru/prev2/581/Ginger_color_Cute_Kittens_580356_300x214.jpg', ...

# Парсинг второй страницы
imgs = get_imgs(2)
print(len(imgs), imgs)
# 30 ['https://s1.1zoom.ru/prev2/570/Cats_White_background_Kittens_569316_300x200.jpg', ...

解析只产生一张图像

如何从列表中打印最大元素（str 类型）的长度？

如何在 PyQT5 中清除 QFrame 的内容

如何将具有特定字符的字符串拆分为两个不同的列表？

导航栏活动元素

是否可以将文本放入数组中？[关闭]

如何一次用多个分隔符拆分字符串？

如何通过 ClassPath 创建 InputStream？

在一个查询中连接多个表

对列表列表中的所有值求和

如何对齐 string.Format 中的列？

解析只产生一张图像

1 个回答

相关问题