如何分析用户搜索需求?

本篇文章站长博客为大家介绍如何分析用户搜索需求?

用户需求分析即“查询分析”,这里涉及两个方面:一个是用户搜索词的分析,另一个是用户搜索意图的分析。通过搜索词的分析可以返回一个可能是用户需要的结果列表,通过用户搜索意图的分析并对搜索结果进行调整,可以获得此用户更加想要的结果列表。

1搜索词分析

当用户向搜索引擎提交查询后,搜索引擎首先判断用户所提交的搜索词的类型:是普通的文本搜索、普通文本带有高级指令的搜索,还是纯高级指令的搜索。这三类搜索词会分别进行不同的索引匹配。

如果是纯高级指令的搜索,那么就会触发搜索引擎相应的结果返回机制。比如,使用site、inurl、intitle等高级指令,搜索引擎会对这种搜索词进行专门的处理。按照搜索词的要求只对索引文件的相应数据进行匹配,比如,site和inurl要求搜索引擎只匹配网页的URL,intitle要求搜

索引擎只匹配网页的itle。并且当搜索引擎识别搜索词为域名或超链接时,也会触发返回固定形式结果的算法。搜索词为URL时,百度会以不同于普通搜索词的、独有的展现形式返回结果。

如果是纯文本的搜索词,搜索引擎就会和处理网页内容一样先进行分词,去除停止词等处理。如果用户输入了明显错误的字,搜索引擎还会依次进行错误矫正,并按照矫正后的词进行检索,如图2-15所示。如果是汉字的错误矫正,一般是根据拼音进行矫正,即错误汉字和娇正后的汉字是同一拼音,否则搜索引擎不会强制矫正,如图2-16所示。

如果是文本加高级指令的搜索情况,那么搜索引擎首先根据高级指令限定搜索范围,然后根据用户提交的文本搜索词,在限定范围内进行检索和排名。

用户搜索词分析完毕后,就可以正常地对索引文件进行检索了。不过为了返回用户最需要的搜索结果,对于搜索意向不明显的关键词,搜索引擎会尝试分析用户的搜索意图后,再进行对索引文件的检索。

2搜索意图分析

当用户搜索一些比较宽泛的关键词时,只根据关键词本身,搜索引擎并不能知道用户确切需要什么,此时就会尝试性地分析用户的搜索意图。比如,用户搜索“霍建华”,搜索引擎并不知道用户到底是想要得到霍建华的个人简介、最新新闻,还是霍建华的相关视频、图片、音乐等。此时会触发搜索引擎的整合搜索功能,不能判断用户确切的需求,那么就把与“霍建华”

相关且不同方向的内容同时呈现出来,让用户自由选择,这样也可以保证在搜索结果的首页就满足用户的检索需求。根据统计分析用户搜索该关键词时所关注的内容比率,搜索引擎也会调整这些内容的排名。

当用户搜索一些通用词汇时,搜索引擎会尝试参考用户所处地域的信息,返回可能是用户最需要的当地的相关信息。如图2-17和图2-18所示分别为在北京和嘉兴同时百度搜索“咖啡厅”所得到的结果,在北京搜索“咖啡厅”得到的搜索结果首页明显加入了“北京信息”,相对应地在嘉兴的搜索结果也加入了“嘉兴信息”。因为搜索“咖啡厅”这类关键词的用户,一般都是在寻找本地信息。这就是地域性的搜索结果,也是搜索引擎分析用户搜索意图后对常规关键词匹配搜索结果的改进,使得搜索引擎结果的用户体验更加友好。

当一个用户多次搜索某一个宽泛关键词(含扩展及同义词)后,如果经常点击同一个网页,那么搜索引擎就会通过Cookie记录用户的这一行为习惯。当用户搜索点击的次数达到一定程度后,再搜索相关关键词时,搜索引擎会优先把用户经常浏览的网页排在前面,这就是“个性化搜索”结果。同上述地域性搜索一样,都是搜索引擎对用户搜索意图进行分析后,对常规关键词匹配搜索结果的改进。并且如果对于同一个搜索词(包含扩展和同义词)搜索结果中的同一网页,搜索点击人数比例过大,也会影响到常规的网页排序,该网页对应的该搜索词相关关键词排名都会有所提升,也就是之前提到的搜索点击率问题。

现在百度搜索推出了“框计算”,对用户搜索意图进行了更加深入地分析,比如,对火车票信息、飞机票信息、日历、简单数据计算等搜索词的分析和结果展现,都体现了百度在用户搜索意图分析方面的技术提升,本书在第11章中会简单介绍一下百度“框计算”。

搜索引擎通过对搜索词、用户属性和用户历史行为的分析,来分析用户的搜索意图,这样就可以比较明确地确定搜索用户真正的需求,从而把用户最想得到的结果提供给用户。在搜索引擎分析完用户的搜索词后,先从索引库中检索与搜索词最相关、最重要的页面,进行排序后,再引入用户搜索意图对排序结果进行调整。下面就来介绍一下内容和关键词的相关性计算。

文章为作者独立观点,不代表站长派立场,本文链接:https://zhanzhangpai.com/?p=1121

免责声明:本站部分内容来源互联网整理,如有侵权请联系站长删除。站长邮箱:1245911050@qq.com

(0)
上一篇 2022年2月23日 上午8:45
下一篇 2022年2月24日 上午8:51

相关推荐

  • 网站301跳转常见问题汇总

    上周有站长朋友在百度站长平台社区提出了一些关于301跳转的问题,我们特别邀请Baiduspider技术专家对此做了解答。在后续与Baiduspider技术专家沟通时,我们又获得了一…

    2022年1月22日
  • 什么样的网站结构对搜索引擎友好

    (1)能找到目标网页 必须有外部链接指向网站首页,这样搜索引擎才能发现我们的网站并进行抓取,然后蜘蛛沿首页内部链接抓取更深层内容页,能很轻松的对网站内容进行遍历抓取。 (2)能抓取…

    2022年3月15日
  • 百度搜索优质内容解读

    什么是优质内容? 如何生产优质内容? 如何让百度搜索选择我的内容? 说起内容生产,每个创作者都有许多“痛”和“懵”。 我们特地邀请了百度搜索产品经理佳岐,为开发者们从优化内容质量的…

    2022年12月30日
  • 网站CSS代码如何优化

    对于网站排名优化来说,css的几乎没有任何影响,但往大的方向如网站优化来说,样式表css的优化就至关重要了,其主要作用即是提高网页的响应速度。 外链CSS css的使用有多种方式,…

    2022年3月15日
  • 飓风算法1.0详情

    算法名称:飓风算法1.0算法内容:严厉打击恶劣采集发布时间:2017-07-04原文详情: 百度搜索于近日推出飓风算法,旨在严厉打击以恶劣采集为内容主要来源的网站,同时百度搜索将从…

    2021年11月5日
  • 谷歌SEO-2022年年应该如何优化谷歌精选摘要

    你希望在不借助外链或者内容更改就能够参与谷歌第一位的排名吗?利用好谷歌精选摘要就可以帮你实现这一点。 精选摘要通常显示在谷歌搜索结果的最顶部。它们通过从排名靠前的页面中提取相关内容…

    2022年2月1日
  • robots文件格式

     robots文件往往放置于根目录下,包含一条或更多的记录,这些记录通过空行分开(以CR,CR/NL, or NL作为结束符),每一条记录的格式如下所示:“<fi…

    2022年3月15日
  • 影响网站关键词排名的负面因素有哪些?

    对于每个站长来说,提高网站排名是做梦都在做的事情,可是百度算法里影响排名的因素有那么多,一味地做优化却还落得过过度优化的问题,这是得不偿失的事。下边笔者来和大家分析下哪些行为会给网…

    2022年3月15日
  • 搜索引擎是如何进行内容处理的?百度蜘蛛页面处理原理介绍

    内容处理即搜索引擎对Spider抓取回来的页面进行处理。处理步骤简单介绍如下。 步骤01要判断该页面的类型 首先要判断该页面的类型是普通网页,还是PDF、Word、Excel等特殊…

    2022年2月21日
  • Robots文件应放在哪里?

    robots.txt 文件必须放在网站的根目录。 放在子目录的 Robots.txt 文件搜索引擎不能爬取到,所以不会起任何作用。 如: https://zhanzhangpai….

    2022年3月15日