同一个网页多个快照的原因

有不少朋友都发现了不同的搜索词或搜索方式,得到同一个网页的百度快照时间可能是不同的。

搜索引擎更新索引的过程,并不是一个新索引替换老索引的过程,对于一个重要的网页,百度可能会同时保留其多个版本的快照,使用不同的搜索词得到的同一个网页的快照版本可能会有所不同。

如果两次搜索中使用的都是常规搜索词,而出现的同一个网页快照时间不同,一般原因是搜索引擎会在多个快照版本中优先推荐最符合用户搜索词的那一个。因为页面内容变动了,所以关键词相关程度就可能不同了,在存在多个版本快照的情况下可能会出现这种情况。当然这并不是唯一的原因,也可能存在其他外界未知的因素。

如果上述这种情况一个是搜索普通关键词,一个是搜索URL,出现同一个网页的快照时间不同,除了上述原因之外,还有可能是前面搜索引擎原理一章中所提到的,百度缓存中的快照和索引库中的快照版本并不同。当用户搜索普通关键词时,由于之前有人搜索过,所以百度直接从缓存中调出了快照;当用户搜索URL时,百度并没有使用缓存中的快照,而是使用了索引库中的快照,从而造成了两次搜索中同一网页出现两个版本的快照。据观察,一般直接搜索网页的URL会得到该网页最新版本的百度快照,搜索目标关键词偶尔会出现目标网页快照停滞在比较早时间上的现象。

文章为作者独立观点,不代表站长派立场,本文链接:https://zhanzhangpai.com/?p=1156

免责声明:本站部分内容来源互联网整理,如有侵权请联系站长删除。站长邮箱:1245911050@qq.com

(0)
上一篇 2022年2月27日 上午8:36
下一篇 2022年2月27日 上午8:43

相关推荐