劲风算法详情及算法解读

算法名称:劲风算法
算法内容:控制恶意构造聚合页的问题对搜索用户的影响
发布时间:2020-02-27
原文详情:


近期,百度搜索技术团队发现,部分网站及智能小程序通过恶意构造聚合页面内容来获取搜索排名,获得搜索用户关注。为了保障搜索用户的体验、保证搜索结果公平,百度搜索将于近期上线劲风算法,控制恶意构造聚合页的问题对搜索用户的影响。

聚合页,是指页面并无文章主体内容,而是多个页面的索引链接围绕在特定主题下的信息整合页。

针对恶劣聚合页问题,搜索一经识别,将会结合站点及智能小程序的用户评价,限制其在搜索结果中的展现。此次算法覆盖百度搜索范围内的所有网站及智能小程序资源。

恶劣聚合页问题主要包括以下四种类型:

1、页面内容与站点本身所属领域不符,或站点无专注领域,多为采集拼凑内容。

问题示例1:站点内容领域分散

劲风算法详情及算法解读

2、页面内容与标题及页面中标记的标签不符。

问题示例2:页面内容与标题不符

劲风算法详情及算法解读

3、由网站搜索功能生成的静态搜索结果页。

问题示例3:静态搜索结果页

劲风算法详情及算法解读

4、空短、无有效信息、失效的聚合页。

问题示例4:无有效信息的聚合页
劲风算法详情及算法解读

以上四类恶劣聚合页问题就是这次劲风算法的主要内容。还请广大开发者关注,及时排查整改。


劲风算法解读

为了更好的帮助广大开发者了解劲风算法,避免出现类似问题影响站点、智能小程序在搜索中的表现,我们结合算法发布后大家关注度较高的问题逐一拆解说明,请广大开发者参考。

本次劲风算法主要针对以下四类恶劣聚合页问题:

一、内容跨领域

页面内容与站点本身所属领域不符,或站点无专注领域,多为采集拼凑内容。

整改建议:

1、开发者应当对站点进行全面自查,清理与站点所属领域不符的聚合页内容;

2、针对站点本身无专注领域的情况,建议开发者将站点内容收敛集中于某个主要领域下,生产专注于该领域的优质原创内容,通过提升内容专注度获得更多搜索用户的点击。

 

问题示例1:站点内容领域分散
劲风算法详情及算法解读

二、题文不符

聚合页内容与标题或标签描述不符,大部分情况是标题所描述的信息超出了页面的承载内容,甚至与页面内容毫不相关。

整改建议:

1、开发者可以评估页面内容与标题的相关性,以此筛选并清理内容与标题、标签不符的聚合页;

2、在内容生产的过程中,开发者应当提升内容与标题、标签的匹配度,保证页面的标题、标签能够准确概括页面内容,没有夸大或不实情况。

问题示例2:页面内容与标题不符
劲风算法详情及算法解读

三、静态搜索结果页

基于网站搜索功能大量生成的静态搜索结果页。

整改建议:

1、建议开发者不要生产此类页面,专注于生产满足用户需求的优质内容资源;

2、对于已有的静态搜索结果页,可以对百度搜索进行robots操作。

问题示例3:静态搜索结果页
劲风算法详情及算法解读

四、无效聚合页

空短、无有效信息、失效的聚合页。

整改建议:

1、请开发者对站点下的页面内容进行排查,清理低质、无效的聚合页面;

2、开发者在生产聚合页时,应当保证页面内容足够丰富、优质,避免出现聚合页中内容资源较少、不符合用户预期的情况。

问题示例4:未提供有效信息的聚合页
劲风算法详情及算法解读

除了以上整改建议外,针对此次劲风算法中开发者关注度较高的几个问题,我们给出了解答及引导,请广大开发者参考。

劲风算法Q&A

Q1:为什么要上线劲风算法?

A1:首先,批量生成的劣质聚合页会造成站内资源泛滥,占用搜索引擎资源,影响百度蜘蛛在收录过程中发现其他优质内容;
其次,通过技术手段批量生成的聚合页,通常存在标题信息对页面内容夸大甚至不实的问题,进而导致搜索用户获取的信息与用户预期之间有较大落差,伤害用户体验;
此外,部分开发者生产劣质聚合页,实际目的是为了吸引用户点击,以此获益,对搜索结果的公正性产生恶劣影响。

Q2:我的网站自带站内搜索功能,用户搜索时会产生正常的搜索结果聚合页,这种情况是否会对我的网站产生影响呢?对于静态的搜索结果页,网站难以排查,如果没有及时删除清理的话,是否会对站点在搜索中的评价产生影响?

A2:对于网站提供给访问者的动态搜索页面,此类页面不会被搜索引擎收录;
对于站点构造的静态搜索结果页,劲风算法会在识别后结合站点的整体搜索表现给予不同程度的处理。

劲风算法将于近期陆续上线,请广大开发者对照以上内容,尽快对自己站点中的聚合页进行排查整改,避免不必要的损失。

文章为作者独立观点,不代表站长派立场,本文链接:https://zhanzhangpai.com/?p=58

免责声明:本站部分内容来源互联网整理,如有侵权请联系站长删除。站长邮箱:1245911050@qq.com

(0)
上一篇 2021年11月5日 下午2:37
下一篇 2021年11月5日 下午2:46

相关推荐

  • robots文件格式

     robots文件往往放置于根目录下,包含一条或更多的记录,这些记录通过空行分开(以CR,CR/NL, or NL作为结束符),每一条记录的格式如下所示:“<fi…

    2022年3月15日
  • SEO是什么意思?什么是SEO优化?

    SEO的中文意思是搜索引擎优化。 通俗理解是:一种通过分析搜索引擎的排名规律,了解各种搜索引擎怎样进行搜索、怎样抓取互联网页面、怎样确定特定关键词的搜索结果排名的技术,最终通过提高…

    2022年3月15日
  • 谷歌SEO:搜索引擎是如何工作的?

    搜索引擎通过三个主要功能工作: 爬行:在 Internet 上搜索内容,查看他们找到的每个 URL 的代码/内容。 索引:存储和组织在爬取过程中发现的内容。一旦页面在索引中,它就会…

    2022年2月18日
  • SEO秘籍之《百度搜索引擎网页质量白皮书》

    网页质量是一个网页满足用户需求能力的衡量,是搜索引擎确定结果排序的重要依据。在网页资源内容与用户需求有相关性的基础上,内容是否完整、页面是否美观、对用户是否友好、来源是否权威专业等…

    2022年12月29日
  • 网站收录与索引的区别是什么

    在过去的一段时间里,大家一度对收录和索引的概念非常模糊,百度工程师也曾“粗暴”地说过“收录和索引是一回事”。但实际工作中,院长发现,其实收录和索引都有其各自的重要意义,并不能含糊地…

    2022年12月30日
  • 经常被采集的技术层面处理方法

    小站新站被采集,自己网站没收录或者没排名,被权重网站采集,而变成了别人的嫁衣,反馈又没有实质性可以证明自己的内容。注意:即使按照下面的说法做也无法杜绝采集,毕竟防君子不防小人。 优…

    2023年1月10日
  • 百度搜索优质内容指南

    1、导言 一直以来,百度搜索从用户角度出发,不断分析和研究用户需求,努力提升搜索结果的优质体验,期望将最优质的搜索结果返回给搜索用户。 什么样的内容才算优质?什么样的内容才能更好的…

    2021年11月5日
  • 网站改版常见问题解析:什么是网站改版?网站改版注意事项?为什么要用改版工具?如何使用改版工具?

    哈喽大家好~ 我(平小雕)带着满满的知识干货又双叒叕回来啦! 经过三期知识的学习,大家是否有更好的掌握网站运营的相关知识呢? 第四期【搜索问答剧场】,让我们从如何使用【网站改版工具…

    2022年7月15日
  • 为什么伪原创文章不收录,伪原创文章不收录解决办法

    伪原创是做站的人最喜欢的更新网站的方式,可是有些人的伪原创被搜索引擎大大喜欢,而有 的却一篇不收,为什么区别如此之大呢?咱们每天看新闻的时候,应该一条原本一模一样的新闻,为什么搜索…

    2022年3月15日
  • 网站URL优化全解析

    一、怎样的URL对搜索引擎友好 1、在搭建网站结构、制作URL时,尽量避开非主流设计,追求简单美即可, 越简单越平常,越好2、不建议URL中含有中文字符,中文字符容易出现识别问题3…

    2021年11月16日