有一个简单的解析器,其任务是检查链接。
如果答案是 200,则必须将链接添加到 xlsx 文件中。
每个后续链接都必须在新行上 - 文件的新行。
在这种形式中,只有最后一个链接适合 xlsx 文件。
import requests
import openpyxl
XL_FILE = 'file.xlsx'
def main():
wb = openpyxl.Workbook()
ws = wb.active
for u in range(1000):
url = ("https://site.com/page/" + str(u) + ".html")
r = requests.get(url)
if r.status_code != 200:
pass
else:
print(url)
ws[2][0].value = url
wb.save(XL_FILE)
wb.close()
if __name__ == "__main__":
main()
print 工作正常,并显示链接被遍历并仅以 200 的响应输出。
如何遍历 xlsx 文件的行并将具有 200 响应的新链接插入每个新链接?
更改您正在写入的单元格的行号
url,如下所示: