我会以 habr`a 的例子来写。
人们可以在那里创建文章,创建后,它被分配一个编号。这就是我的问题出现的地方,这篇文章是存储在某种数据库中,还是与本文编号的服务器资源中立即生成的xml(xtml)文件?
如果第二个的工作,即 生成一个文件,我还是明白了,添加到数据库后,索引就无法通过这个文件了(毕竟不会挂在服务器上),使用这个链接立即从数据库生成一个页面是好多了(对我来说),但问题是这里有一个,但是索引将如何发生?或者他们没有?
问题:添加文章后,他们是在服务器资源中生成文件还是将文本本身添加到数据库中?
让我们从搜索引擎定期绕过网络上所有现有域的事实开始。当他们找到一个新域时,他们会向主机询问该域主页的地址。收到她的代码后,他们会在其中查找指向内部页面的链接,并逐个浏览它们,并对每个页面进行与主页面相同的操作。此外,如果站点的所有文件夹和文件包含有用的内容并且未关闭索引,例如在 robots.txt 中,搜索引擎就会索引这些文件夹和文件,即使此类文件夹和文件在任何地方都没有作为页面中的链接提及。
服务器如何准确地向访问者提供页面,包括。对于搜索引擎,取决于页面的呈现方式。一般来说,有三种方式,同时三种类型的CMS:
1)数据库驱动(动态生成页面,从数据库中获取内容,例如,这就是 WordPress 的工作方式),
2)平面文件(动态生成页面,从文件中获取内容,例如 Grav),
3)静态页面,由静态页面生成器(例如 Jekyll、Gatsby 等)预先生成。
从性能、网站推广及其安全性的角度来看,最后一次将页面返回给访问者的方式是最好的,并且每年都越来越受欢迎。