经常被采集的技术层面处理方法

小站新站被采集,自己网站没收录或者没排名,被权重网站采集,而变成了别人的嫁衣,反馈又没有实质性可以证明自己的内容。注意:即使按照下面的说法做也无法杜绝采集,毕竟防君子不防小人。

优化层面

1、添加内容时候增加一些,能代表自己的东西“XXX网提示” “XXX提醒”,品牌词的变种词“百度知道”变成“bai度了解”“佰镀知道”,对方采集没有及时替换的情况下,反馈可以充当证据,不要说内容是自己原创的他人采集为什么算他的,没有实际证据的情况,也可能你采集他人的把时间给修改提前了。

2、给图片增加水印。

技术层面

被采集站点必须有最新入口,才会被采集者采集到最新且没有收录的内容,我们只要考虑,新内容不被采集到的,等新内容收录之后,在放出来,它采集意义也不大。

1、延时更新首页,首页尽可能不要实时更新,几天一更新,网站把蜘蛛养起来之后首页就可以更新不那么勤快了,举例百度经验,百度知道 首页根本没有最新内容。

2、延时更新列表,和首页道理一样,只要做好主动推送和sitemap就不用考虑首页列表引导蜘蛛进入到最新内容里。

3、限制列表页数,限制5-10页,没有用户翻几十页上百页的。正常用户都是有需求才来,我的网站就限制十页,百度经验限制3页,还不是最新内容。

4、限制用户列表页面展示内容数量。

5、内容页链接尽可能无规则,避免使用递增有规律的url,假如链接有规律递增,采集者不需要最新入口都可以采集最新内容,使用百度近一周收录获取到最新链接进行递增。

举例: htt ps://jin gyan.baidu.com/article/1.html

htt ps://jin gyan.baidu.com/article/2.html

以此类推

htt ps://jing yan.baidu.com/article/99999999.html

爱奇艺、腾讯视频、链接无规则,就很难采集。

一般提交内容,后台就会生成静态页面,只要把静态页提交给百度就好。

我常用的这些办法就是以上这些,完全屏蔽不了,采集者甚至用代理IP抓相关内容爬搜索结果页来采集你。

不建议新站这么操作,等到蜘蛛稳定爬取了,还可以偷偷懒,偷懒更新不一定是坏事,让勤快的采集者无路可走。

注:动态站你也可以选择调用几天前的数据。提前做好sitemap主动api推送等操作。

限制访客IP的通常做法我就不说了,大家可以百度。


内容来源:百度站长论坛

原文链接:http://bbs.zhanzhang.baidu.com/thread-2191267-1-1.html

文章为作者独立观点,不代表站长派立场,本文链接:https://zhanzhangpai.com/?p=4119

免责声明:本站部分内容来源互联网整理,如有侵权请联系站长删除。站长邮箱:1245911050@qq.com

(0)
上一篇 2023年1月10日 下午5:33
下一篇 2023年1月31日 上午11:48

相关推荐

  • 如何优化网站长尾关键词?长尾关键词优化方法介绍

    任何一个行业的名称就可看作核心关键词或者主关键词,一般来说这样的关键词都是很热门,优化 难度比较大的。我们就转而对这些词进行有效合理的修饰,这些修饰之后的词一般可称为长尾关键词,需…

    2022年3月15日
  • 什么是链接农场和内容农场?

    现阶段的搜索引擎算法对网站的内容和链接都很注重,所以为了套取搜索引擎流量的站长和EO人员,就抛弃网站为用户服务的本质,而为搜索引擎制造内容和链接,并发明了盛极一时的链接农场和内容农…

    2022年2月28日
  • 百度搜索持续打击盗版网文站点公告

    发布日期:2023-04-11 百度公司高度重视知识产权保护。近期,百度搜索通过主动摸排,并结合版权方的投诉与反馈,发现部分站点内存在大量涉嫌侵害网络文学版权方合法权益的盗版内容,…

    2023年4月14日
  • 谷歌SEO-如何高效编写完美的元描述?

    元描述是一个 HTML 属性,用于描述页面内容。它可以在搜索结果中以摘录的形式出现在标题标签下方,以提供更多内容。 以下是代码段的外观: <meta name= “descr…

    2022年1月31日
  • SEO秘籍之《百度搜索引擎网页质量白皮书》

    网页质量是一个网页满足用户需求能力的衡量,是搜索引擎确定结果排序的重要依据。在网页资源内容与用户需求有相关性的基础上,内容是否完整、页面是否美观、对用户是否友好、来源是否权威专业等…

    2022年12月29日
  • 防止网站内部搜索被他人恶意利用

    相信很多站长遇到过这种情况:网站内的搜索功能被不良分子利用,通过在站内搜索框中不断搜索敏感关键词,产生一大批TITLE上带有敏感关键词的垃圾搜索结果页(如下图)。由于Baidusp…

    2022年2月6日
  • 内链优化注意事项,如何优化网站内链?

    有不少网站根本不做外链,只在内容上发力,配合优秀的内链设计就把网站的SEO做得很好,在搜索引擎上获得极高的权重和流量。内链的优化也是一个很大的话题,不同类型的网站不同类型的内容都会…

    2022年3月9日
  • 如何快速提升domain结果数

    曾经有不少公司和初级SEO人员受培训机构或者站长工具的误导,把domain的结果数当成网站百度反链的数据。相信现在还有一些刚刚了解EO的朋友会比较重视自己的网站在百度搜索中的dom…

    2022年3月2日
  • 请问百度对新站点有流量加持政策吗

    请问百度对新站点有流量加持政策吗 问题:我是做淘宝 阿里的,所以关注 对新产品 新站点的一些流量加持政策,不知道搜索引擎有对新站点的流量加持政策么? 答案:有扶持,备案的新站有扶持…

    2022年7月6日
  • 百度spider介绍

    1. 什么是Baiduspider Baiduspider是百度搜索引擎的一个自动程序,它的作用是访问互联网上的网页,建立索引数据库,使用户能在百度搜索引擎中搜索到您网站上的网页。…

    2022年2月6日