什么是反作弊算法?反作弊算法有哪些类型?

本篇文章站长博客介绍什么是反作弊算法?反作弊算法有哪些类型?

在搜索引擎的架构中过滤也是很重要的一环,在Spider抓取部分会过滤掉重复和垃圾页面,在进行排序和呈现时同样还会进行一次过滤,来保证搜索结果的质量。反作弊就是过滤环节中的主要组成部分。当下搜索引擎排名的重要参考因素主要有内容、链接、网站权重和用户体验,所以作弊也一般是从这几方面入手。第12章会详细讨论一下常见的作弊手法,这里主要来讨论一下搜索引擎是如何进行反作弊的,反作弊过程中是否会出现误伤,以及站长和EO人员应该如何避免被搜索引擎误伤。

虽然搜索引擎针对每种作弊行为所做的反作弊动作和算法各不相同,但是大体上还是有一定规律可循的。搜索引擎会利用黑白名单和作弊特征研究两方面进行反作弊算法升级。

1.黑白名单

搜索引擎会根据网站内容的质量、权重、品牌建立白名单,也会找出明显作弊严重的网站建立黑名单。搜索引擎会认为白名单中网站所推荐的网站都是好的、健康的网站,含有黑名单中网站链接的网站可能会存在某种问题。

例如:链向白名单中网站的网站不一定是健康的,同时黑名单中网站链向的网站也不一定是不健康的。但是有多个白名单网站链向同一个网站,那么这个网站就很可能是健康的:同一个网站链向了多个黑名单中的网站,就可以把其认定为不健康的网站。

在整个互联网中,黑白名单中的网站不可能和名单外的网站都有直接链接关系,所以搜索引擎会给这种白名单的链接一定的信任值,这个信任值随着链接级数的增加而逐级衰减:同样,从黑名单网站反向开始,会给最终链接指向黑名单网站的各级链接一个不信任值,这个值也是逐级递减的。对于一个黑白名单之外且和黑白名单中网站没有直接联系的网站,搜索引擎会计算它得到的信任值和不信任值,当达到或超过搜索引擎设置的阈值之后,就会把其列为健康网站或者不健康网站。

这是一种很常见的反作弊方式,在EO工作中体现最明显的就是选择服务器和交换友情链接。选择服务器时,大家都希望自己独立使用一台服务器或者一个P;选择虚拟空间时,也会检查相同IP的网站是否有作弊嫌疑,以免被相同P网站连累。虽然百度官方声明不会按照P惩罚网站,但还是远离作弊网站比较稳妥。交换友情链接时就更明显了,一般都会检查对方有无作弊嫌疑或降权嫌疑,以免自己把链接指向不健康的网站而遭到搜索引擎的惩罚。

2.作弊特征研究

作弊特征研究是现在搜索引擎进行反作弊的主要手法。当发现一个对搜索结果影响很大的作弊网站或一种新的作弊手法时,一般不会只是人工地把这个或这些网站降权或者屏蔽,而是潜心研究这个网站或这些网站到底是怎么作弊的,以及钻了搜索引擎技术和逻辑上的什么漏洞。

当发现漏洞后就会提升算法弥补漏洞,同时对这种作弊方法进行有针对性的打击。Goge近两年所发布的算法升级都是有针对性的,不是针对操纵PR的链接作弊,就是针对网站影响用户体验行为的作弊等。百度更是如此,从2012年6月份以来的算法升级,每次都会针对特定的作弊行为。这都是研究作弊手法的特征后进行有针对性的算法升级的。

因为是针对某一特征的反作弊算法升级,也有可能会出现这种情况:某个网站没有作弊,但是也有类似作弊站的某些特征,而被搜索引擎捎带处罚了一下,视特征的符合程度遭受到的处罚程度不同。也就是说搜索引擎在反作弊的算法升级过程中,很有可能会产生误伤。这种误伤会不会产生,以及误伤程度和误伤范围要取决于搜索引擎打击作弊的力度和算法的精度。

比如,百度搜索在2012年10月23日针对超链接作弊的算法升级过程中,只是取消了作弊链接的作用,而因为有很多有着优质内容的综合门户网站也都参与了此种作弊,所以才没有对参与作弊的网站进行打击。这种反作弊算法也就是把作弊的情况整理了一下,作弊站顶多失去作弊部分所带来的排名和流量,而没有得到其他额外的惩罚,这样没有作弊的网站就更不可能得到惩罚了,顶多有几个外链的作用消失而已。

又如,百度搜索在2012年6月28日针对采集站和垃圾站的算法升级中,因为是识别垃圾和采集,又因为搜索引擎暂时不能精确地识别原创,所以就导致了一些网站被连累,产生了一定误伤。后来百度搜索部门对投诉的网站进行了详细分析,虽然只有少数的网站被确定为误伤,但是可以肯定这种算法升级有一定的负面连锁反应。

站长和EO人员在工作中,不仅仅要尽心尽力地运营自己的网站,还要避免自己和作弊站、垃圾站有所靠近或关联,同时要尽可能地向优质高权重网站靠近或扯上关系,相信这也是大部分站长和EO人员一直努力的方向。但是很少有朋友有心避免被反作弊算法牵连,搜索引擎的算法再精准也是人设计出来的,并不是神造的、完美无暇的,所以有作弊就会有反作弊,反作弊稍微严格一点就可能产生误伤,作为站长和EO人员应该尽可能避免这种被误伤的情况发生。

站长和EO人员要潜心研究搜索引擎想要打击的作弊行为的特征。比如,某种作弊行为都会选择使用一套开源CMS程序或者模版,那么你就要尽可能避免使用同一个CMS和模版:买卖链接的网站一般都会设置隐藏的链接块或文本块,并且卖的链接中经常会有医疗病种、私服、赌博或者其他暴利、高竞争的关键词,那么你就要尽可能地不使用隐藏的TAB来做友情链接,重要的是最好不要和搜索引擎重点打击行业的网站做友情链接等。搜索引擎打击所有的作弊行为中,肯定都会根据这种作弊行为的特征进行算法升级,那么作为一个“良民”站长或EO人员就应该避免和这些作弊行为有相似的地方。比如,某个人长相和奥巴马一样可能会受到追捧,某人长得和“凤姐”一样就可能会受到到鄙视或嘲笑。

最后,需要了解的是,针对反作弊,搜索引擎也并不是总处于被动状态。搜索引擎也一直在研究站长作弊背后的动机和站在对立角度审视自己的各种算法,一般在算法上线之前都会设计相关算法,把站长容易操纵的作弊因素根据特征从正常的算法中过滤掉,并不是一味地亡羊补牢和处罚作弊站点。这应该也是近年来大众认为“EO越来越难做”的原因之一。

文章为作者独立观点,不代表站长派立场,本文链接:https://zhanzhangpai.com/?p=1139

免责声明:本站部分内容来源互联网整理,如有侵权请联系站长删除。站长邮箱:1245911050@qq.com

(0)
上一篇 2022年2月25日 上午8:02
下一篇 2022年2月25日 上午8:30

相关推荐

  • 百度快照和网页权重的关系

    本篇文章站长博客为大家介绍百度快照和网页权重的关系 在友情链接交换和网站分析中,站长和EO人员一般都比较习惯看目标网站的首页或相应页面的百度快照。根据以往的EO经验,权重越高的、更…

    2022年2月27日
  • 什么是缓存机制?什么是缓存更新机制?

    本篇文章站长博客介绍什么是缓存机制?什么是缓存更新机制? 缓存就是临时文件交换区,是可以进行高速数据交换的存储器,它先于内存与CPU交换数据,因此速率极快。现在为了加快用户查询的响…

    2022年2月25日
  • 网站导航优化注意事项?如何优化网站导航?

    网站导航的本职作用是引导用户和Spider更好地浏览网站内容。常见的网站导航有主导航、多级导航、底部导航和面包屑导航等。这些导航链接在SEO中,不仅可以引导用户和Spider测览全…

    2022年3月7日
  • 网站URL优化注意事项:如何优化网站URL

    并不是所有的SEO人员都能在工作中接触到URL优化。不少公司网站不需要新的URL规则,也不需要改版重新设计URL,就算设计URL结构,一般也都是SEO负责人来设计的,基层SEO人员…

    2022年3月7日
  • 网站索引量下降常见原因及解决方案

    索引量是流量的基础,索引量数据的每一个变动都拨动着站长敏感的神经,“索引量下降之后该如何着手分析”一直是各位讨论的热门话题。这次站长社区版主老吕又拔刀相助了,看看史上最全的百度索引…

    2022年12月30日
  • 百度搜索内容质量白皮书

    百度搜索在中文用户信息获取上发挥了不可替代的作用,用户体验直接影响搜索整体满意度。百度搜索内容质量白皮书将以连载的方式,陆续将如何做好网站建设、网站优化发布出来,以此来与网站一起为…

    2022年1月30日
  • 网站被黑注入博彩色情页面指南

    欧洲杯激战正酣,又到了博彩利益集团疯狂入侵正常站点、注入垃圾博彩页面疯狂跳转的时期,百度通过内部监控发现优质站点、尤其是新闻源站点被黑数量呈上升趋势。为保证广大用户的搜索体验不受伤…

    2022年2月2日
  • 谷歌SEO-SEO文案写作:提升内容质量和谷歌排名的12条实用技巧

    过去四年,Ahrefs博客 每月搜索访问量从原来12,000增长至现在的468,000。 我们是怎么做到的? 我们找到了一种方法——通过结合优质的SEO基础知识 和好的文案写作方法…

    2022年2月5日
  • 如何寻找友情链接?在哪里找友情链接?

    需要交换就需要寻找对象。现在随着SEO行业的发展,已经有多种渠道可以寻找链接交换对象了,常见的寻找方式如下。 (1)现在有大量的链接交换QQ群,里面有很多有同样链接交换需求的站长或…

    2022年3月16日
  • 内链优化注意事项,如何优化网站内链?

    有不少网站根本不做外链,只在内容上发力,配合优秀的内链设计就把网站的SEO做得很好,在搜索引擎上获得极高的权重和流量。内链的优化也是一个很大的话题,不同类型的网站不同类型的内容都会…

    2022年3月9日