网站内容生产相关问答——回答部分我进行了精简,基本上都是按照原意,写的。
“注:”的部分很少,是我自己添加的。
回看地址:http://live.baidu.com/m/media/pclive/pchome/live.html?room_id=4468058124&source=h5pre(问答部分在18分钟之后)
——————————
问:为什么我们发的原创文,第一天给的排名,第二天就不收录。为什么刚收录的网站复制整个标题在百度搜索里面。没有搜到?
答:我之前被收录,然后就没有被收录,对应咱们最后说的这个资源维护这块儿,就是你有进场就有退场,但如果要是说你这个是很异常的退场,就突然流量没了,这一点可能需要大家自查一下,咱们站点显得这些数据的质量有没有一些异常行为啊,或者是有一些异常的流量。
注:这块说的听说建议,回看直播19分29秒。
问:一个新站他的内容质量没有存在违规的情况。并且也被抓取了,但是就是没有收录,或者说收录之后没有展现,这种页面是否是属于低质的?
答:新站建设的时候像一些备案啊,首页建设,内容建设等等,最好是建设好之后再放出来,一开始就有一个好的出发点,也希望给百度爬虫一定的时间周期去发现,还是大家可以耐心等待一下。
问:索引量好多天都不会更新,然后它更新的变化,依据到底是?
答:site语法 或 站长后台索引拉取的数据源头都是相同的,但这个数据本身统计是一个实时更新动态变化的一个数字。
site语法和站长平台索引不一致或长期不更新,这些理论上都是有可能出现的。因为这两个数字应该都是正确的,只是会有时间上的差异。
问:是不是网站在上线前就做好了整个网站的内容。并且填充了大量优质原创的页面?符合搜索引擎的网页质量要求,那这种站点上线后,是不是通常就有,比较好的排名?
答:对,是的,希望把这些内容也能建设好。
问:为什么最近收录量。会有一个异常的。暴涨或者是暴跌那最近我们是不是有个什么(算法/更新/策略)。
答:收录量并不是一个很关键的数字,还是关注一下流量,如果流量比较稳,收录量大家可以先往下放一放。
如果要是流量有非常异常的波动,这种可以针对性的去跟进。
问:自适应的站点。PC不收录没有排名,但是移动端的页面被收录了有排名?
答:被识别成wise是比较符合预期的,如果要这个页面,它本身也符合PC的规范,同时他应该也会被PC收录,所以这块儿可以把具体的case反馈一下。
就是自适应进wise符合预期,但是如果他要是本身就是一个很wise的页面很wise样式的页面他可能也不会进入PC(收录)。
问:为什么百度PC端的蜘蛛自动抓取了网站的移动端?
答:对于未知的链接,爬虫不能准确地去预判它到底是PC还是移动端,但是只要能正常的抓回页面就不会影响网站内容的收录。
问:百度的收录信息不是很稳定,有的时候一天就收录了,有的时候很久都不收录, 可能是什么原因导致的?
答:本身收录的这个周期或者是抓取的周期是受很多因素影响的。
问:采集的内容或者是低质量的内容,被法覆盖了如何进行整改,是删除提交死链还是在原来的内容修改?
答:采集的内容占比比较大的话,那建议把这个资源直接的进行404死链接设置,robots设置。
注:这个问题是我问的,其实我更想知道可不可以在原基础上改。
问:搜索链接可以查到结果,品牌名和公司名是没有办法搜到,这种情况是否,不够预期的呢?
答:不完全符合预期, 如果要是说我搜刚开始搜链接能搜到,但是搜title或者是搜一些品牌没有搜到的话,建议大家做一些那个官网认证等等,这些应该会有好处。
注:这块我感觉答偏了
问:网站以前被黑当时已经处理,还有很多快照造成降权,但是该链接不存在于网站无法筛选出来这些链接。
答:可以像百度这边再站长平台反馈一下,如真的是被黑退场,就是也要及时反馈到百度这边来,会把这些地址给清理掉。
会有一个整改周期周期,不是说你这边改完之后就立刻能到得到一个权重的恢复或者是我们权重就立刻上来了。
问:site语法出来的数据从去年开始,他的数据量都是一个整数,这样的数据是否仅是百度搜索给的一个月的数据量
答:索引量数值并不完并不是一个预估的量,他可能和真实真实数字有一定的出入,但不会差的特别大。
问:正常的API提交和手动提交哪个重要,还是两个都需要。
答:这两个接口都是可以进行提交的,但是每一个提交方式其实门槛都是不一样的,我们是建议用高门槛的这个提交的方式。
因为你实际上,在后台进行判断的时候,如果你要是经过了严格的认证,你本身提交的内容的可信度, 我们认为更高一些。
注:这块说明百度“倾向于”api提交,通常使用api的站长,站长后台一定都会关联主体等信息认证。
问:新站已经做过备案,并且提交提交api但是为什么还要还没有被收录可能是什么原因导致的。
答:本身抓取调度是有一定周期的也有一定的频次每一个数据源(站带你)的分配也是不一样的,其实主要还是看咱们的容质量又不是说咱们有链接了或者提交链接就能马上被收录,耐心等待一下。
注:配额问题,百度要观察站点质量,来分配爬取次数,不可能新站就几百上千爬取次数,而是通过站点内容质量判断,慢慢递增的一个过程,大家常说的黑盒/审核期也出自于这块的吧。
问:流量的异常,我们可以从哪些地方进行自查。
答:关注站点访问IP是不是正常,数据产生的流量是不是正常。
注:我倾向于观察,百度站长后台索引,流量与关键词,流量统计工具,然后再是站长工具等平台
问:直播提到的导流是指的交换友链吗?
答:交换友链是其中的一种,正常导流站点之间是相互的,交换友链当然指的是正常优质站符合预期的那种。但是那种你去帮助一些低质垃圾站点扶持他扶持它们获得权重,是错误的一种方式。
注:我认为广告链接,内容里面非本站链接,非本站描文本链接,都应该是导链。
问:原创的文章长期没有收录。然后再站长平台反馈之后说是。收录状态是正常的。不是不是我真的是属于符合预期的?
答:明确原创内容并非是采集拷贝改写,而是自己从0到1完全建设出来的,有些反馈案例,的确是原创,但是原创内容特别简单,质量也不是特别高,简单几句话,排版布局也比较差。
上一问的延伸:
收到一个反馈说我们的原创内容被采集,被采集的这个数据我原创的,我们没有被收录,采集的收录了。
不说那个是原创,直观的感受是采集方人家那个做的更好,页面体验,页面质量,页面布局样式,整个浏览过程都非常顺畅。
辛辛苦苦原创的文章,被采集以后,反而人家加工的更好,这一点大家一定要建设好,当然如果出现这种情况,也希望大家反馈,这种采集百度肯定会站在原创方的。
问:现在提倡生产优质的内容,但是如果站点每天的内容量有限的话,有没有其他的更好的去提升网站曝光或展现的一个优化。
答:资源量是一个误区,不是说生产的链接资源越多越好,要看单链的这个质量。
问:网站改版产生了一些死链。已经做了404提交现在的情况是百度过来抓取首页了,但是首页有新内容。正常的情况下,应该继续抓取新的内容,但是现在没有抓取了。这个问题应该怎么解决。
答:抓取相关的内容,大家可以在站长社区的相关的问题收集贴中去进行反馈, 然后我们的版主也会收集站点,详细信息提供给我们的工程师工程师会进行问题解答。
注:本节课因为讲的是索引,没有深讲。
问:每天网站都是定量的进行原创内容的更新,但是第一天收录20几条,第二天收录十几条。第三天又瘦了20几条,这样的周期性的变化,是否是正常的。
答:这个是正常的。
问:少部分的站点的主页被收录了,但是里面的图片没有。没办法正常显示,这种情况,有没有什么更好的优化方法。
答:如果要是搜索结果页点到落地页图片没有出来,那可能自身的这个图片服务器有问题。
那个搜索内容页,也并不是每个页面有图片就会出图。关注一下自己这个页面,特别是内容页这个图片的质量。一定要足够好,然后还有他的所在的那个位置啊,然后还有对应的图片尽量都建设起来。
问:页面的质量是从哪些维度判断的这个呢,其实判。
答:具体参考百度站长平台 《百度搜索优质内容指南》
问:已经收录的内容,如果后期再进行变更或更新的话,是否会影响他前的收录效果,还是说已经收录后的内容,尽量他进行少的改动。
答:首先要看具体需求,如果你的内容真的是要变更还是要变更的,如果变更之后,理论上只要你质量不下降,不会影响之前的沉重和排名。
注:侧面说明内容收录后可以修改。
问:在site主域名的时候,搜索结果中会有其他站点结果出来,这种情况是什么原因导致。
答:理论上不会出现,site语法还是比较规范的,而且也是很通用的一种方式,遇到这种情况可以反馈回来我们看。针对性的去看一看。
问:网站上线之前要发布多少篇文章要合适是越多越好吗?还是说打造优质的。文章然后数量少一些少而精。
答:网站上线之前。不是依靠数量而是依靠质量,所以还是建议大家去发布优质的文章,而不要去追求自然的数量。
问:原创的文章百度没有收录,但是其他平台收录了,这种问题是不是由于文章质量不好导致的。
答:提供详细的关键词,链接给到反馈中心,然后我们会进行排查。
注:我认为还有还要参考站点质量这个因素。
来源:百度站长论坛
原文链接:http://bbs.zhanzhang.baidu.com/thread-2192444-1-1.html
文章为作者独立观点,不代表站长派立场,本文链接:https://zhanzhangpai.com/?p=4104
免责声明:本站部分内容来源互联网整理,如有侵权请联系站长删除。站长邮箱:1245911050@qq.com