我在 .htaccess 中编写了自己的站点错误页面,目前为止是其中最常见的两个:
ErrorDocument 403 "/error/403/"
ErrorDocument 404 "/error/404/"
而且我发现 Apache 只是“按原样”下载指定的文件,也就是说,它不仅将它们显示给用户,还会将它们提供给脚本,例如,如果样式表的路径不正确,并且带有代码200.幸运的是,代码不会长时间更改:
header("HTTP/1.1 403 Forbidden");
和
header("HTTP/1.1 404 Not Found");
分别。但是页面的主体呢?显然,站点脚本和第三方程序——搜索机器人、RSS 聚合器、连接到站点 API 的应用程序等。- 获取错误代码就足够了,但是是否有可能以某种方式只给他们,以及在浏览器中打开页面的用户 - 整个文档?区分自动呼叫和手动呼叫的最佳方法是什么?
如果我理解正确的话,您是说如果指定了指向某些资产(脚本、样式表)的无效链接,那么您的服务器会尝试返回 HTML 文档。该问题最明显的解决方案是简单地确保链接始终有效。通常,一个样式表和一个 JS 文件就足以用于整个站点。而且,如果您使用模板,那么只需在一个文件中指定资产的路径就足够了,而不用担心某些地方会损坏。
但无论如何,使用路由和 MVC 是有意义的。开始使用这两种技术 - 这样的问题将自行解决。没有人再使用 .htaccess 来处理错误。
在我看来,您几乎在 2017 年都没有使用框架,而这些问题是开箱即用的。我建议您阅读我的回答,我在其中谈到了类似的主题并解释了为什么您应该在您的应用程序、MVC、路由以及可能的框架中使用单一入口点:
这个想法没有意义。如果搜索引擎收到明确的响应代码(例如,Forbidden 或 Not Found),那么它就不会再关心页面的主体是什么样子了。一段时间后,他会简单地将其排除在索引之外。
你应该这样做:
在所有情况下,您都应该返回有效的 HTTP 代码:403 或 404。
通过用户代理。每个机器人都有自己的称号。