RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题 / 1594345
Accepted
Artem Gafarov
Artem Gafarov
Asked:2024-09-20 17:45:19 +0000 UTC2024-09-20 17:45:19 +0000 UTC 2024-09-20 17:45:19 +0000 UTC

HTTPS 请求 VK 服务器下载视频

  • 772

我正在编写代码从 VK 下载视频,而不使用 VK API。任务如下:获取视频链接,然后向该 URL 发送请求并接收可观看该视频的页面作为响应。即模拟来自真实浏览器的请求。

为此,我尝试从真实的浏览器请求中复制所有标头,如下所示:

    req, err := http.NewRequest("GET", URL, nil)

    req.Header.Set("User-Agent", "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/126.0.0.0 YaBrowser/24.7.0.0 Safari/537.36")
    req.Header.Set("Accept", "text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7")
    req.Header.Set("Accept-Encoding", "gzip, deflate, br, zstd")
    req.Header.Set("Accept-Language", "ru,en;q=0.9")
    req.Header.Set("Cache-Control", "max-age=0")

    req.Header.Set("Sec-Ch-Ua", "\"Not/A)Brand\";v=\"8\", \"Chromium\";v=\"126\", \"YaBrowser\";v=\"24.7\", \"Yowser\";v=\"2.5\"")
    req.Header.Set("Sec-Ch-Ua-Mobile", "?0")
    req.Header.Set("Sec-Ch-Ua-Platform", "\"macOS\"")
    req.Header.Set("Sec-Fetch-Dest", "document")
    req.Header.Set("Sec-Fetch-Mode", "navigate")
    req.Header.Set("Sec-Fetch-Site", "same-origin")

    req.Header.Set("Upgrade-Insecure-Requests", "1")

    req.Header.Set("Priority", "u=0, I")

作为回应,我希望看到一个带有视频的页面以供进一步工作,但实际上我收到了一个页面,其中要求我更新/安装最新版本的浏览器。在 Pastebin 上收到的响应示例:URL。页面的视觉展示

问题是:如何在 Go 中模拟来自“现代”浏览器的请求?

完整的代码如下所示:

const URL = "https://m.vk.com/video-85466065_456241727"

req, err := http.NewRequest("GET", URL, nil)

req.Header.Set("User-Agent", "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/126.0.0.0 YaBrowser/24.7.0.0 Safari/537.36")
    req.Header.Set("Accept", "text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7")
req.Header.Set("Accept-Encoding", "gzip, deflate, br, zstd")
req.Header.Set("Accept-Language", "ru,en;q=0.9")
req.Header.Set("Cache-Control", "max-age=0")

req.Header.Set("Sec-Ch-Ua", "\"Not/A)Brand\";v=\"8\", \"Chromium\";v=\"126\", \"YaBrowser\";v=\"24.7\", \"Yowser\";v=\"2.5\"")
req.Header.Set("Sec-Ch-Ua-Mobile", "?0")
req.Header.Set("Sec-Ch-Ua-Platform", "\"macOS\"")
req.Header.Set("Sec-Fetch-Dest", "document")
req.Header.Set("Sec-Fetch-Mode", "navigate")
req.Header.Set("Sec-Fetch-Site", "same-origin")

req.Header.Set("Upgrade-Insecure-Requests", "1")

req.Header.Set("Priority", "u=0, i")

client := &http.Client{}

res, err := client.Do(req)

golang
  • 1 1 个回答
  • 51 Views

1 个回答

  • Voted
  1. Best Answer
    Pak Uula
    2024-09-21T18:53:49Z2024-09-21T18:53:49Z

    在我看来,您从服务器得到了正确的响应。浏览器也会接收它,但它们执行 JS 脚本并重新加载页面。

    证明:禁用 JS 的 chrome 截图 在此输入图像描述

    恕我直言,事情是这样的。服务器返回以下 cookie 集:

    remixlang=0; Path=/; Domain=vk.com; Expires=Sat, 20 Sep 2025 22:04:34 GMT; Secure; SameSite=None
    remixstlid=9078596624758655055_ZqB9FcuPZghch6BGgDDoHd6B6dWFHp8zzggYkZA9Z4c; Path=/; Domain=vk.com; Expires=Sun, 21 Sep 2025 10:30:22 GMT; Secure; SameSite=None
    remixstid=2019772071_3Tf1dSfwaoxqIPj5Cp2cBYNVL3TxXfC9sHqzoRmsRws; Path=/; Domain=vk.com; Expires=Wed, 24 Sep 2025 19:51:47 GMT; Secure; SameSite=None
    remixua=15%7C612%7C171%7C3990382815; Path=/; Domain=vk.com; Expires=Wed, 17 Sep 2025 21:01:56 GMT; Secure; SameSite=None
    remixff=0; Path=/; Domain=vk.com; Expires=Tue, 01 Oct 2024 10:30:22 GMT; Secure; SameSite=None
    remixua=15%7C612%7C171%7C3990382815; Path=/; Domain=vk.com; Expires=Wed, 24 Sep 2025 21:52:38 GMT; Secure; SameSite=None
    

    但是浏览器发送这些 cookie(cookie 的值不匹配,因为有些是在程序中接收的,有些是从浏览器接收的 - 比较名称集):

    remixlang=0; 
    remixua=43%7C-1%7C214%7C2996390830;
    remixstlid=9063256236099454727_RxskMlmfWzownbJe8AmH8YjmlSPWFAlQwzMC43sIbpD;
    remixstid=359988006_2z3dEIQUE5D2Ea0lRSz5SqCIS4JgGf2rqQIhQKJLkIo;
    remixff=0;
    remixmdevice=2560/1440/1/!!-!!!!!!!!/1302
    

    remixmdevice浏览器不是从 header接收 cookie Set-Cookie,而是从页面中的脚本接收 cookie。如果没有这个 cookie,服务器会显示一个“Bad Browser”页面,有了它就会显示一个正常页面

    我尝试用手添加这个饼干,结果成功了。这是我的标题集:

        req.Header.Set("Accept", "text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7")
        req.Header.Set("Accept-Encoding", "gzip, deflate, br, zstd")
        req.Header.Set("Accept-Language", "ru-RU,ru;q=0.9,en-US;q=0.8,en;q=0.7,ko-KR;q=0.6")
        req.Header.Set("Cache-Control", "no-cache")
    
        // req.Header.Set("Cookie", `remixlang=0; remixua=43%7C-1%7C214%7C2996390830; remixstlid=9063256236099454727_RxskMlmfWzownbJe8AmH8YjmlSPWFAlQwzMC43sIbpD; remixstid=359988006_2z3dEIQUE5D2Ea0lRSz5SqCIS4JgGf2rqQIhQKJLkIo; remixff=0; remixmdevice=2560/1440/1/!!-!!!!!!!!/1302`)
    
        req.Header.Set("DNT", "1")
        req.Header.Set("Pragma", "no-cache")
        req.Header.Set("Priority", "u=0, i")
        req.Header.Set("Sec-Ch-Ua", `"Chromium";v="128", "Not;A=Brand";v="24", "Google Chrome";v="128"`)
        req.Header.Set("Sec-Ch-Ua-Mobile", "?0")
        req.Header.Set("Sec-Ch-Ua-Platform", `"Android"`)
        req.Header.Set("Sec-Fetch-Dest", "document")
        req.Header.Set("Sec-Fetch-Mode", "navigate")
        req.Header.Set("Sec-Fetch-Site", "same-origin")
        req.Header.Set("Upgrade-Insecure-Requests", "1")
        req.Header.Set("User-Agent", "Mozilla/5.0 (Linux; Android 10; K) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/129.0.6668.54 Mobile Safari/537.36")
    
        req.AddCookie(&http.Cookie{Name: "remixmdevice", Value: "2560/1440/1/!!-!!!!!!!!/1302"})
    

    我不知道如何动态形成这个cookie。但目前它正在发挥作用。

    附言。作为一个成年人,你当然应该使用 Selenium,但这真是一个魔鬼阿尔巴......

    • 1

相关问题

  • windows上的protoc编译错误

  • 递归打印包依赖

  • Golang 算法 XTEA ECB 库“golang.org/x/crypto/xtea”

  • 如何将 IMEI 转换为字节并返回 golang

  • 如何创建文件并将其移动到新目录?

  • go中的函数参数中是否有cv-qualifier的类似物?

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    我看不懂措辞

    • 1 个回答
  • Marko Smith

    请求的模块“del”不提供名为“default”的导出

    • 3 个回答
  • Marko Smith

    "!+tab" 在 HTML 的 vs 代码中不起作用

    • 5 个回答
  • Marko Smith

    我正在尝试解决“猜词”的问题。Python

    • 2 个回答
  • Marko Smith

    可以使用哪些命令将当前指针移动到指定的提交而不更改工作目录中的文件?

    • 1 个回答
  • Marko Smith

    Python解析野莓

    • 1 个回答
  • Marko Smith

    问题:“警告:检查最新版本的 pip 时出错。”

    • 2 个回答
  • Marko Smith

    帮助编写一个用值填充变量的循环。解决这个问题

    • 2 个回答
  • Marko Smith

    尽管依赖数组为空,但在渲染上调用了 2 次 useEffect

    • 2 个回答
  • Marko Smith

    数据不通过 Telegram.WebApp.sendData 发送

    • 1 个回答
  • Martin Hope
    Alexandr_TT 2020年新年大赛! 2020-12-20 18:20:21 +0000 UTC
  • Martin Hope
    Alexandr_TT 圣诞树动画 2020-12-23 00:38:08 +0000 UTC
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5