Spider和普通用户的区别?搜索引擎蜘蛛和用户有什么区别?

所有的全文搜索引擎都表示自己的Spider对网站的抓取行为和普通用户的访问行为没有太大区别。站在普通用户的角度这句话的确没有问题,但是站在站长和EO的角度这句话就不太对了。网页上有很多东西普通用户看不到也分辨不清,但是Spider可以;网页上也有很多东西普通用户可以看到并分辨清楚,但是Spider不可以。可以说Spider是一个既聪明又弱智的普通用户,Spider有着普通用户访问行为的大部分特性,但是也有不少差异。

  • Spider可以很容易地分辨出网页中是否有隐藏内容,是否被挂了黑链等,但是不能完全了解网页中图片的内容,也不能很好地读取JavaScript、Iframe、Ajax和Flash中的内容,普通用户却是恰恰相反;
  • Spider没有Referer,对网站的抓取全部都是直接访问,而普通用户中除了直接访问的用户外一般都是有Referer的;Spider不支持Cookie,但普通用户的浏览器一般是支持的;
  • Spider不会主动注册登入网站,但是普通用户是可以的;原则上Spider不会抓取和分析网站robots中已经屏蔽的内容,但是普通用户是可以正常访问的;
  • Spider对于有多个动态参数网站的抓取,可能会陷入死循环,但是普通用户是不会的;Spider对于列表中前几页的新内容抓取可能不好,但是感兴趣的普通用户会依次浏览;
  • Spider暂时还不能真正判断文章是不是原创,但是普通用户可以通过多种方式来确定文章是原创还是采集转载等。
  • Spider毕竞是人为技术驱动的程序,与普通用户还是有着非常大的区别的,因此给了站长和SEO人员很大的操作空间。站长和SEO人员在充分了解到Spider和普通用户的区别后,可以更方便地优化网站,使得网站内容被充分抓取,网站整体在搜索引擎中有个良好的表现;同时也可以利用两者的区别,使得在不影响搜索引擎抓取和排名的情况下,给普通用户更友好的用户体验,比如,判断用户Referer给用户推荐内容等;当然,不排除有些站长和SEO人员会利用这些区别,采用很多极端的技术作弊手法,在普通用户感觉不到的地方,误导Spider对网站内容的判断,而恶意抢夺很多本不应该得到的搜索流量,这是不可取的。无论如何,都有必要深入了解两者的差异。

文章为作者独立观点,不代表站长派立场,本文链接:https://zhanzhangpai.com/?p=1086

免责声明:本站部分内容来源互联网整理,如有侵权请联系站长删除。站长邮箱:1245911050@qq.com

(0)
上一篇 2022年2月21日 上午9:17
下一篇 2022年2月21日 上午9:22

相关推荐

  • SEO秘籍之《百度搜索引擎网页质量白皮书》

    网页质量是一个网页满足用户需求能力的衡量,是搜索引擎确定结果排序的重要依据。在网页资源内容与用户需求有相关性的基础上,内容是否完整、页面是否美观、对用户是否友好、来源是否权威专业等…

    2022年12月29日
  • 常用搜索引擎高级命令

    一些常用的高级搜索引擎命令,包括以下: 1.Site 这个是最常见的高级搜索命令,作用是查询网站的收录情况,并且这个命令在所有的搜索引擎里是通用的。用法:site:zhanzhan…

    2022年3月15日
  • 网站JS代码如何优化

    javascript代码对于网站排名优化同样没有多大影响,但从网站优化的角度来看却是至关重要的一步优化操作,优良的javascript代码可以大幅度提升网页的响应速度! 外链js代…

    2022年3月15日
  • 如何给WordPress添加时间因子,WordPress时间因子正确添加方法?

    如何给Wordpress添加时间因子,Wordpress时间因子正确添加方法? 之前的文章中给大家介绍过《百度搜索落地页时间因子规范》相关内容,那么为什么要给网站增加时间因子呢?如…

    2022年7月6日
  • 谷歌seo入门指南第三章:关键词研究

    seo的出发点是了解目标客户要搜索的内容

    2022年1月10日
  • 网站被黑注入博彩色情页面指南

    欧洲杯激战正酣,又到了博彩利益集团疯狂入侵正常站点、注入垃圾博彩页面疯狂跳转的时期,百度通过内部监控发现优质站点、尤其是新闻源站点被黑数量呈上升趋势。为保证广大用户的搜索体验不受伤…

    2022年2月2日
  • 清风算法4.0详情

    为保障用户的下载体验,让提供优质下载服务的站点得到合理的展现,促进下载行业生态良性发展,百度搜索将于近期升级清风算法,针对不符合规范的低质下载站,将限制其在百度搜索结果中的展现。 …

    2021年11月11日
  • 蓝天算法2.0详情

    原文标题:百度升级『蓝天算法』,加强“站点构造目录发布低质内容”识别能力 原文发布日期:2021-07-27 近日,百度搜索技术团队发现“站点构造目录发布低质、虚假等与站点主题无关…

    2022年2月8日
  • 正文内容在SEO方面的注意事项

    关于内容原创性问题前面的章节已经谈过,下面主要来谈一下内容在SEO方面的常规性优化。 一、关于内容布局关键词方面 内容页一般是整个网站最底层的页面了,也是结构上权重最低的页面,所以…

    2022年3月12日
  • 新站前期收录/排名注意事项

    很多新站问的最多的便是收录还有排名,甚至有些站长站点刚刚上线一两个月,seoer或站长开始追求排名和收录。 一个新站点,刚上线仅提交了(非验证站点链接提交:ziyuan.baidu…

    2022年12月29日