什么是robots文件?robots文件有必要设置吗

什么是robots.txt文件?

搜索引擎机器人通过链接抵达互联网上的每个网页,并抓取网页信息。搜索引擎机器人在访问一个网站时,会首先检查该网站的根目录下是否有一个叫做robots.txt的纯文本文件。当我们的网站有一些内容不想被搜索引擎收录,我们可以通过设置robots.txt文件告知搜索引擎机器人。

如果网站上没有禁止搜索引擎收录的内容,则不用设置robots.txt文件,或设置为空。

robots.txt文件有什么必要?

从SEO的角度,robots.txt文件是一定要设置的,原因:

1、网站上经常存在这种情况:不同的链接指向相似的网页内容。这不符合SEO上讲的“网页内容互异性原则”。采用robots.txt文件可以屏蔽掉次要的链接。

2、网站改版或URL重写优化时原来不符合搜索引擎友好的链接需要全部屏蔽掉。采用robots.txt文件删除旧的链接符合搜索引擎友好。

3、一些没有关键词的页面,屏蔽掉更好。

4、一般情况下,站内的搜索结果页面屏蔽掉更好。

文章为作者独立观点,不代表站长派立场,本文链接:https://zhanzhangpai.com/?p=1620

免责声明:本站部分内容来源互联网整理,如有侵权请联系站长删除。站长邮箱:1245911050@qq.com

(0)
上一篇 2022年3月15日 下午3:44
下一篇 2022年3月15日 下午3:49

相关推荐

  • 百度搜索引擎检索系统概述

    前面简要介绍过了搜索引擎的索引系统,实际上在建立倒排索引的最后还需要有一个入库写库的过程,而为了提高效率这个过程还需要将全部term以及偏移量保存在文件头部,并且对数据进行压缩,这…

    2022年2月1日
  • 谷歌seo入门指南第二章:seo基础知识

    了解如何为seo成功建立网站,并掌握seo的四个主要方面

    2022年1月6日
  • 同一个网页多个快照的原因

    有不少朋友都发现了不同的搜索词或搜索方式,得到同一个网页的百度快照时间可能是不同的。 搜索引擎更新索引的过程,并不是一个新索引替换老索引的过程,对于一个重要的网页,百度可能会同时保…

    2022年2月27日
  • 谷歌SEO:影响网站收录的因素有哪些?如何让搜索引擎收录网站

    如果您使用 Google Search Console 或“site:domain.com”高级搜索运算符,发现您的一些重要页面从索引中丢失和/或您的一些不重要页面被错误地编入索引…

    2022年2月18日
  • 清风算法3.0详情

    算法名称:清风算法3.0算法内容:规范下载行业生态发布时间:2018-10-16原文详情: 为规范下载行业生态、保障百度搜索用户下载体验,百度搜索对外发布《百度搜索下载站质量规范》…

    2021年11月5日
  • 烽火算法4.0详情

    算法名称:烽火算法4.0算法内容:控制回退按钮失效问题发布时间:2021-08-19原文详情: 近期,百度搜索接到用户关于部分站点存在回退按钮失效情况的投诉。为了保障用户的搜索体验…

    2021年11月11日
  • SEO常见网站流量数据统计指标及名词介绍

    流量统计中会有各种数据来反映网站当前的流量状况,功能越强大的流量统计工具就拥有越丰富的数据,比如GA有儿十个流量报表,母个报表都有着特定的作用。由于SE的工作就是尽力把搜索引擎上的…

    2022年3月10日
  • 如何用程序识别Baiduspider ua

    近日 ,Baiduspider针对移动抓取user agent(以下简称ua)进行了升级,与PC端的抓取ua做到版本统一,均称为Baiduspider/2.0。从此次更新的移动ua…

    2022年2月3日
  • 这些常见的百度搜索算法违规问题,千万别犯!

    百度搜索算法一直是开发者们关注的重点。你的站点或者智能小程序是否符合百度搜索算法规则?你的内容质量是否满足了用户需求?你的页面布局是否符合用户体验标准?一起来回顾一下百度搜索运营同…

    2022年12月30日
  • 做SEO需要懂哪些技术

    有人说seo就是个打杂的,哪里缺人就要去哪里。从这句话我们可以隐约的看出可能要懂很多技术。 1、html基础 做seo需要让我们的网站被搜索引擎所喜欢(五点告诉你什么样的网站才能赢…

    2022年3月15日