有这样一个需要检查用户输入的链接是否有恶意指标,即网站上是否有可能造成危害的东西。
下面是如何在PHP中实现这样的东西,或者至少是可以显式识别和实现的验证算法和指标?我去了谷歌,有一张支票,但对于某些网站来说,它只是“没有数据”,这并不好。
更新
应用了病毒总 API。限制令人困惑,但付费选项会做
有这样一个需要检查用户输入的链接是否有恶意指标,即网站上是否有可能造成危害的东西。
下面是如何在PHP中实现这样的东西,或者至少是可以显式识别和实现的验证算法和指标?我去了谷歌,有一张支票,但对于某些网站来说,它只是“没有数据”,这并不好。
更新
应用了病毒总 API。限制令人困惑,但付费选项会做
如果您的意思是自己编写,那么您花在分析和开发上的时间,包括对此类保护的支持,不太可能与此功能的需要和有用性相对应。
使用第三方站点检查API会更容易,覆盖大部分危险站点,并接受一小部分作为错误。
不可能覆盖所有网站,应将部分责任转移给决定关注此链接的用户。
对您的网站进行这种保护有什么意义吗?
现代浏览器实际上不允许通过可执行代码损害用户的设备,如果用户遵守基本的安全规则,并且没有通过选中“安装来自未知来源的应用程序”复选框在移动设备上打开下载的 apk 文件。
填满内存导致浏览器崩溃,各种钓鱼网站不算,第一种可能是程序员的错误,第二种情况一切都是基于用户的愚蠢以及此类网站没有真人参与的用户不会被超过一台扫描仪找到。
如果您正在创建某种项目,其中链接扮演主要角色之一(例如:搜索引擎),警告没有经验的用户注意错误操作可能是有意义的。无论如何,是否需要它值得考虑?
WEB病毒搜索算法
在网络上搜索病毒时,有两种分析方法:
静态分析是对恶意插入的搜索:javascript 代码、网络钓鱼页面的链接等。这是一个预先组装的数据库,在该数据库上分析页面而不对其执行操作,如果它不包含预定义的签名,那么它将无法找到病毒。我们发现了与病毒相关的签名或某些内容,然后将其标记为可疑或将其添加到数据库中。
动态分析是在页面上执行某些操作的扫描仪。例如,机器人在不同的浏览器中加载页面,内部计时器加速,传递给危险函数(eval)的参数被跟踪,引用者被替换等。在这里你的想象力不受限制,你甚至可以通过点击各种链接在站点周围进行真正的转换,但目的是一样的——强制加载恶意代码,例如显示窗口“你的计算机被锁定! !!发送一百万卢布,否则现在所有数据都将被删除!! ”
为了搜索危险内容,使用了一种综合方法,它结合了静态和动态分析。每个公司都使用自己的一套算法来查找相应的危险站点,并针对特定的产品开发相应的特征库。
我可以写一张简单的支票吗?笼统?
如果您想编写一个简单的网络钓鱼检查,您可以通过 URL 获取页面并静态搜索被阻止链接或可疑内容的列表(在此处输入您的卡号,立即将您的收入增加三倍!真的 10 分钟!!!),但同样,您可能需要浏览器或最新的 JS 引擎。
如果你检查页面是否有 JS 病毒,你需要一个 JS 脚本病毒特征库,但是我在哪里可以找到呢?老实说,我无法回答你。你可以开始自己作曲,但这一切都很费力。
开源软件和文档
有很多关于病毒搜索和分类算法的文章,例如:Computer Virus Strategies and Detection Methods (2008) , The New Age of Computer Virus and Its Detection (2012),当然随着新的出现它会变得有点过时技术,但基本原则无处可逃。
如果你对杀毒程序的工作原理感兴趣,可以阅读开源的ClamAv杀毒软件的源代码,有爱好者根据其签名数据库编写了一个PhpMussel包装器,或者在 Github 上搜索名为杀毒、病毒检测等的项目.
结论
识别所有病毒并不容易——这是一项非常复杂的任务,有很多方法可以做到这一点。
您会发现自己陷入了一场无休止的游戏,恶意软件作者在其中创造新技术,您必须改进检测它们的方法,否则一段时间后您的保护算法将变得无关紧要。
现有 Virustotal 验证服务的一个很好的聚合器,截至 2018 年,它每分钟可以免费运行多达 4 个请求,并通过一个请求检查站点与许多数据库。