我们从https://www.sravni.ru/bank/gazprombank/debetovaja-karta/visagold/umnaya/?currency=RUB
拿一张桌子
有这样的代码:
import requests
from lxml import html
from bs4 import BeautifulSoup
url = 'https://www.sravni.ru/bank/gazprombank/debetovaja-karta/visagold/umnaya/?currency=RUB'
r = requests.get(url)
page = r.text
def get_table():
data = []
global page
import unicodedata
un = unicodedata.normalize
soup = BeautifulSoup(page, "html.parser")
table = soup.find('table')
table_body = table.find('tbody')
rows = table_body.find_all('tr')
for row in rows:
cols = row.find_all('td')
cols = [un("NFKD",ele.text.strip())+' ' for ele in cols]#
data.append([ele for ele in cols if ele])
return data
print(get_table())
以及如何使用空格?
在这里查找答案。
替换这个:
对于这个设计:
结果:
没错,在这种情况下,某些地方会有额外的空格。
如果你删除 more
+' '
,那么至少最后不会有多余的空格。