RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题 / 681858
Accepted
Xyanight
Xyanight
Asked:2020-06-21 16:18:55 +0000 UTC2020-06-21 16:18:55 +0000 UTC 2020-06-21 16:18:55 +0000 UTC

你怎么知道一个 url 是指向网站页面的链接还是文件下载?

  • 772

遇到了问题。我正在开发一个用于查看 VKontakte 组的移动客户端。我在帖子的附件中显示链接。如果链接指向网络上的页面,我需要在设备的标准浏览器中打开这样的链接,或者如果链接指向文件,我需要使用我的应用程序开始下载。我不认为这可能是一个真正的问题,因为,例如,该模块urlparse被证明是完全无用的:

print(urlparse('http://play.google.com/store/details?id=org.name.old&rdid=org.name.old).path)
>>> play.google.com/store/details

这个链接:

print(urlparse('http://page/file.txt).path)
>>> /file.txt

在这里,如何确定链接指向的内容变得完全不清楚http://play.google.com/store/details?id=org.name.old&rdid=org.name.old。很明显,例如,模块os在这里也无济于事。

是否真的有必要使用os.path.splitext,从链接中提取扩展名(如果存在),并检查该扩展名是否属于已知文件类型?

python
  • 3 3 个回答
  • 10 Views

3 个回答

  • Voted
  1. Best Answer
    insolor
    2020-06-21T19:00:30Z2020-06-21T19:00:30Z

    只能拿到http响应头,看content-type. 如果它包含text/html,那么它就是一个网页。

    例子:

    import requests
    
    url = 'https://yandex.ru'
    r = requests.head(url)
    print(r.headers['content-type'])  # 'text/html; charset=UTF-8'
    
    # Ссылка на скачивание заглавной страницы Википедии в виде pdf
    url = 'https://ru.wikipedia.org/api/rest_v1/page/pdf/Заглавная_страница'
    r = requests.head(url)
    print(r.headers['content-type'])  # 'application/pdf'
    

    要根据请求处理重定向,您需要指定allow_redirects=True(默认情况下,该功能head 是禁用的):

    url = 'http://ya.ru'  # Редиректит на https://ya.ru
    r = requests.head(url, allow_redirects=True)
    print(r.headers['content-type'])  # 'text/html; charset=UTF-8'
    
    • 6
  2. jfs
    2020-03-29T02:57:45Z2020-03-29T02:57:45Z

    如果Content-Disposition http 标头显示附件,则将链接下载为文件(可以指定标头中的名称)。根据此标头rfc 6266 ,可以内联显示或下载相同的内容:

    如果处置类型匹配“附件”(不区分大小写),则表示接收方应提示用户在本地保存响应,而不是正常处理(根据其媒体类型)。

    在 Python 上:

    import urllib.request
    
    with urllib.request.urlopen(url) as r:
        if r.headers.get_content_disposition() == 'attachment':
            download(r)
        else:
            process_as_usual(r)
    
    • 1
  3. limitedeternity
    2020-06-21T18:16:58Z2020-06-21T18:16:58Z

    有必要确定链接是否以代码中指定的某个特定扩展名结束。

    如果以 结尾,则下载。

    否则,它会在标准浏览器中打开页面。

    from urllib.parse import urlsplit  
    import webbrowser
    import wget
    
    url = 'http://play.google.com/store/details?id=org.name.old&rdid=org.name.old' # Или же http://page.com/file.txt
    if not urlsplit(url)[2].endswith(".txt") and not urlsplit(url)[2].endswith(".mp4"): # И так далее.
        webbrowser.open_new_tab(url)
    else:
        wget.download(url, out="dl_content/file.txt")
    
    • 0

相关问题

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    Python 3.6 - 安装 MySQL (Windows)

    • 1 个回答
  • Marko Smith

    C++ 编写程序“计算单个岛屿”。填充一个二维数组 12x12 0 和 1

    • 2 个回答
  • Marko Smith

    返回指针的函数

    • 1 个回答
  • Marko Smith

    我使用 django 管理面板添加图像,但它没有显示

    • 1 个回答
  • Marko Smith

    这些条目是什么意思,它们的完整等效项是什么样的

    • 2 个回答
  • Marko Smith

    浏览器仍然缓存文件数据

    • 1 个回答
  • Marko Smith

    在 Excel VBA 中激活工作表的问题

    • 3 个回答
  • Marko Smith

    为什么内置类型中包含复数而小数不包含?

    • 2 个回答
  • Marko Smith

    获得唯一途径

    • 3 个回答
  • Marko Smith

    告诉我一个像幻灯片一样创建滚动的库

    • 1 个回答
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Алексей Шиманский 如何以及通过什么方式来查找 Javascript 代码中的错误? 2020-08-03 00:21:37 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    user207618 Codegolf——组合选择算法的实现 2020-10-23 18:46:29 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5