我想知道是否可以在 VK 中创建一个页面解析器来提取所有用户的图像(头像、墙壁、保存的照片等),以便通过神经元运行它们?我知道这听起来不太好,但如果这些图片属于公共领域并且将被自主处理,那为什么不呢。我对一个技术点感兴趣,是否可以做到这一点(例如,在Python中)?我只是还没有任何编写解析器的经验,我想知道该往哪个方向深入。
我想知道是否可以在 VK 中创建一个页面解析器来提取所有用户的图像(头像、墙壁、保存的照片等),以便通过神经元运行它们?我知道这听起来不太好,但如果这些图片属于公共领域并且将被自主处理,那为什么不呢。我对一个技术点感兴趣,是否可以做到这一点(例如,在Python中)?我只是还没有任何编写解析器的经验,我想知道该往哪个方向深入。
正如 @Alexey Shimansky 在评论中提到的,您需要深入研究该服务的 http api,这将是最合适的选项(但不是唯一的选项),但是,值得理解的是,我们不是在谈论官方。 api,其文档由 VK 公开提供。 VK 官方并没有提供管理 VK 页面的 API,但在需要的时候正是如此。
我推荐这个库: https ://github.com/python273/vk_api - 这是一个基于 requests 库开发的用于在您的个人页面下使用 VKontakte api 的包装器。该库有一个社区,如果出现问题,请查看此处并提出问题:https://t.me/python273_vk_api
熟悉 requests 库也是一个好主意: https: //pypi.org/project/requests/
有一种更难实现的方法,它的工作速度会比较慢,但这是从几乎所有网络资源进行解析的通用方法。我们正在讨论自动控制浏览器。您可以使用selenium来实现此目的:https://selenium-python.readthedocs.io/,尽管我建议使用playwright https://playwright.dev/python/docs/intro作为selenium的替代品。