本篇文章站长博客介绍什么是反作弊算法?反作弊算法有哪些类型?
在搜索引擎的架构中过滤也是很重要的一环,在Spider抓取部分会过滤掉重复和垃圾页面,在进行排序和呈现时同样还会进行一次过滤,来保证搜索结果的质量。反作弊就是过滤环节中的主要组成部分。当下搜索引擎排名的重要参考因素主要有内容、链接、网站权重和用户体验,所以作弊也一般是从这几方面入手。第12章会详细讨论一下常见的作弊手法,这里主要来讨论一下搜索引擎是如何进行反作弊的,反作弊过程中是否会出现误伤,以及站长和EO人员应该如何避免被搜索引擎误伤。
虽然搜索引擎针对每种作弊行为所做的反作弊动作和算法各不相同,但是大体上还是有一定规律可循的。搜索引擎会利用黑白名单和作弊特征研究两方面进行反作弊算法升级。
1.黑白名单
搜索引擎会根据网站内容的质量、权重、品牌建立白名单,也会找出明显作弊严重的网站建立黑名单。搜索引擎会认为白名单中网站所推荐的网站都是好的、健康的网站,含有黑名单中网站链接的网站可能会存在某种问题。
例如:链向白名单中网站的网站不一定是健康的,同时黑名单中网站链向的网站也不一定是不健康的。但是有多个白名单网站链向同一个网站,那么这个网站就很可能是健康的:同一个网站链向了多个黑名单中的网站,就可以把其认定为不健康的网站。
在整个互联网中,黑白名单中的网站不可能和名单外的网站都有直接链接关系,所以搜索引擎会给这种白名单的链接一定的信任值,这个信任值随着链接级数的增加而逐级衰减:同样,从黑名单网站反向开始,会给最终链接指向黑名单网站的各级链接一个不信任值,这个值也是逐级递减的。对于一个黑白名单之外且和黑白名单中网站没有直接联系的网站,搜索引擎会计算它得到的信任值和不信任值,当达到或超过搜索引擎设置的阈值之后,就会把其列为健康网站或者不健康网站。
这是一种很常见的反作弊方式,在EO工作中体现最明显的就是选择服务器和交换友情链接。选择服务器时,大家都希望自己独立使用一台服务器或者一个P;选择虚拟空间时,也会检查相同IP的网站是否有作弊嫌疑,以免被相同P网站连累。虽然百度官方声明不会按照P惩罚网站,但还是远离作弊网站比较稳妥。交换友情链接时就更明显了,一般都会检查对方有无作弊嫌疑或降权嫌疑,以免自己把链接指向不健康的网站而遭到搜索引擎的惩罚。
2.作弊特征研究
作弊特征研究是现在搜索引擎进行反作弊的主要手法。当发现一个对搜索结果影响很大的作弊网站或一种新的作弊手法时,一般不会只是人工地把这个或这些网站降权或者屏蔽,而是潜心研究这个网站或这些网站到底是怎么作弊的,以及钻了搜索引擎技术和逻辑上的什么漏洞。
当发现漏洞后就会提升算法弥补漏洞,同时对这种作弊方法进行有针对性的打击。Goge近两年所发布的算法升级都是有针对性的,不是针对操纵PR的链接作弊,就是针对网站影响用户体验行为的作弊等。百度更是如此,从2012年6月份以来的算法升级,每次都会针对特定的作弊行为。这都是研究作弊手法的特征后进行有针对性的算法升级的。
因为是针对某一特征的反作弊算法升级,也有可能会出现这种情况:某个网站没有作弊,但是也有类似作弊站的某些特征,而被搜索引擎捎带处罚了一下,视特征的符合程度遭受到的处罚程度不同。也就是说搜索引擎在反作弊的算法升级过程中,很有可能会产生误伤。这种误伤会不会产生,以及误伤程度和误伤范围要取决于搜索引擎打击作弊的力度和算法的精度。
比如,百度搜索在2012年10月23日针对超链接作弊的算法升级过程中,只是取消了作弊链接的作用,而因为有很多有着优质内容的综合门户网站也都参与了此种作弊,所以才没有对参与作弊的网站进行打击。这种反作弊算法也就是把作弊的情况整理了一下,作弊站顶多失去作弊部分所带来的排名和流量,而没有得到其他额外的惩罚,这样没有作弊的网站就更不可能得到惩罚了,顶多有几个外链的作用消失而已。
又如,百度搜索在2012年6月28日针对采集站和垃圾站的算法升级中,因为是识别垃圾和采集,又因为搜索引擎暂时不能精确地识别原创,所以就导致了一些网站被连累,产生了一定误伤。后来百度搜索部门对投诉的网站进行了详细分析,虽然只有少数的网站被确定为误伤,但是可以肯定这种算法升级有一定的负面连锁反应。
站长和EO人员在工作中,不仅仅要尽心尽力地运营自己的网站,还要避免自己和作弊站、垃圾站有所靠近或关联,同时要尽可能地向优质高权重网站靠近或扯上关系,相信这也是大部分站长和EO人员一直努力的方向。但是很少有朋友有心避免被反作弊算法牵连,搜索引擎的算法再精准也是人设计出来的,并不是神造的、完美无暇的,所以有作弊就会有反作弊,反作弊稍微严格一点就可能产生误伤,作为站长和EO人员应该尽可能避免这种被误伤的情况发生。
站长和EO人员要潜心研究搜索引擎想要打击的作弊行为的特征。比如,某种作弊行为都会选择使用一套开源CMS程序或者模版,那么你就要尽可能避免使用同一个CMS和模版:买卖链接的网站一般都会设置隐藏的链接块或文本块,并且卖的链接中经常会有医疗病种、私服、赌博或者其他暴利、高竞争的关键词,那么你就要尽可能地不使用隐藏的TAB来做友情链接,重要的是最好不要和搜索引擎重点打击行业的网站做友情链接等。搜索引擎打击所有的作弊行为中,肯定都会根据这种作弊行为的特征进行算法升级,那么作为一个“良民”站长或EO人员就应该避免和这些作弊行为有相似的地方。比如,某个人长相和奥巴马一样可能会受到追捧,某人长得和“凤姐”一样就可能会受到到鄙视或嘲笑。
最后,需要了解的是,针对反作弊,搜索引擎也并不是总处于被动状态。搜索引擎也一直在研究站长作弊背后的动机和站在对立角度审视自己的各种算法,一般在算法上线之前都会设计相关算法,把站长容易操纵的作弊因素根据特征从正常的算法中过滤掉,并不是一味地亡羊补牢和处罚作弊站点。这应该也是近年来大众认为“EO越来越难做”的原因之一。
文章为作者独立观点,不代表站长派立场,本文链接:https://zhanzhangpai.com/?p=1139
免责声明:本站部分内容来源互联网整理,如有侵权请联系站长删除。站长邮箱:1245911050@qq.com