百度搜索引擎检索系统概述

2022年2月1日上午10:54 • 搜索引擎

前面简要介绍过了搜索引擎的索引系统，实际上在建立倒排索引的最后还需要有一个入库写库的过程，而为了提高效率这个过程还需要将全部term以及偏移量保存在文件头部，并且对数据进行压缩，这涉及到的过于技术化在此就不多提了。今天简要给大家介绍一下索引之后的检索系统。

检索系统主要包含了五个部分，如下图所示：

（1）Query串切词分词即将用户的查询词进行分词，对之后的查询做准备，以“10号线地铁故障”为例，可能的分词如下（同义词问题暂时略过）：

10 0x123abc

号 0x13445d

线 0x234d

地铁 0x145cf

故障 0x354df

（2）查出含每个term的文档集合，即找出待选集合，如下：

0x123abc 1 2 3 4 7 9…..

0x13445d 2 5 8 9 10 11……

……

……

（3）求交，上述求交，文档2和文档9可能是我们需要找的，整个求交过程实际上关系着整个系统的性能，这里面包含了使用缓存等等手段进行性能优化；

（4）各种过滤，举例可能包含过滤掉死链、重复数据、色情、垃圾结果以及你懂的；

（5）最终排序，将最能满足用户需求的结果排序在最前，可能包括的有用信息如：网站的整体评价、网页质量、内容质量、资源质量、匹配程度、分散度、时效性等等，之后会详细给大家介绍。

文章为作者独立观点，不代表站长派立场，本文链接：https://zhanzhangpai.com/?p=459

免责声明：本站部分内容来源互联网整理，如有侵权请联系站长删除。站长邮箱：1245911050@qq.com

百度SEO知识

赞 (0)

谷歌SEO-如何高效编写完美的元描述？

上一篇 2022年1月31日下午1:49

网站安全风险及应对方案

下一篇 2022年2月1日上午11:18

搜索引擎

代码优化简介，什么是网站代码优化？

所谓代码优化是指对程序代码进行等价(指不改变程序的运行结果)变换。程序代码可以是中间代码(如四元式代码)，也可以是目标代码。等价的含义是使得变换后的代码运行结果与变换前代码运行结果…

2022年3月15日
搜索引擎

百度智能小程序的图片怎样优化?如何提升百度小程序页面加载速度?

谁在影响小程序页面的加载速度在智能小程序开发的过程中，经常需要引入图片资源，如果图片使用不当(图片数量过多、体积过大的图片)，在加载时会消耗更多的系统资源，从而影响整个页面的加载…

2022年3月18日
搜索引擎

谷歌SEO：2022年你需要的 8 个链接建设工具（免费+付费）

近十年来，链接建设一直是我最关注的东西。在为 Ahrefs 工作之前，我担任过链接建设顾问，帮助数十个客户构建了数百个链接。我在这段时间学到的是，你不需要用到所有的链接建设工具。…

2022年2月9日
搜索引擎

谷歌SEO-LSI 关键词：定义与重要性

很多人说Latent Semantic Indexing(LSI)关键词可以让谷歌的排名更好，这个是真的吗？又或者这只是另一个SEO的谣言？通过阅读其他的关于LSI关键词的文章你…

2022年2月7日
搜索引擎

网站不收录原因分析——百度spider抓取篇

目前百度spider抓取新链接的途径有两个，一是主动出击发现抓取，二就是从搜索资源平台的链接提交工具中获取数据，其中通过主动推送功能“收”上来的数据最受百度spider的欢迎。对于…

2022年12月30日
搜索引擎

百度搜索优质内容指南常见问题及解答

上周百度搜索发布了《百度搜索优质内容指南》，指南发布以后，我们收到了不少内容生产者发来的关于“生产者资质”和“内容质量”的提问。小编特地对这些问题进行了整理，给大家进行“补习”，快…

2022年12月30日
搜索引擎

谷歌SEO：哪些内容容易被搜索引擎判定为垃圾内容

稀薄的内容虽然网站通常拥有不同主题的独特页面，但较旧的内容策略是为关键字的每次迭代创建一个页面，以便针对那些高度具体的查询在第 1 页上排名。例如，如果您销售婚纱，您可能已经为…

2022年2月20日
搜索引擎

目标关键词有哪些特征?

一般情况下，目标关键词具有这些特征: 1、目标关键词一般作为网站首页的标题。 2、目标关键词一般是2-4个字构成的一个词或词组，名词居多。 3、目标关键词在搜索引擎每日都有一定数目…

2022年3月15日
搜索引擎

SEO是什么意思？什么是SEO优化？

SEO的中文意思是搜索引擎优化。通俗理解是：一种通过分析搜索引擎的排名规律，了解各种搜索引擎怎样进行搜索、怎样抓取互联网页面、怎样确定特定关键词的搜索结果排名的技术，最终通过提高…

2022年3月15日
搜索引擎

网站结构对seo的影响

很多seoer在做seo的时候更多的关心网站内容以及外链的质量，很少来关心网站的结构，殊不知，一个好的网站结构对seo来说能达到事半功倍的效果。那么搜索引擎友好的网站结构对seo有…

2022年3月15日