谷歌seo入门指南第六章:搜索引擎优化技术

重要的是要确保没有技术上的障碍阻止

技术 SEO 曾经是 SEO 中最重要的部分。页面需要可被抓取,可索引,才有机会获得排名。但与内容和链接相比,现在许多的要素对SEO的影响微乎其微。

我们编写了这份初学者指南,以帮助你了解一些基础知识,以及最好将时间花在那些能最大程度地发挥影响的要素上。整篇文章链接了很多其他资源,最后还有更多资源供你了解更多信息。

让我们开始吧。

Chapters

技术SEO基础1. 技术 SEO 基础


理解抓取2. 理解抓取


理解索引3. 理解索引


技术SEO速胜要素4. 技术 SEO 速胜要素


附加技术要素5. 附加技术要素


技术SEO优化工具6. 技术 SEO 优化工具

 


内容
  • 1. 技术SEO基础
  • 2. 理解抓取
  • 3. 理解索引
  • 4. 技术SEO速胜要素
  • 5. 附加技术要素
  • 6. 技术SEO优化工具
谷歌seo入门指南第六章:搜索引擎优化技术

Chapter 1

技术 SEO 基础

由于这是初学者指南,让我们从基础开始。

什么是技术 SEO

技术 SEO 是优化你的网站以帮助 Google 等搜索引擎查找、抓取、理解和索引你的网页。目标是让搜索引擎找到并提高排名。

技术 SEO 有多复杂?

看情况。基础知识并不难掌握,但技术 SEO 可能很复杂且难以理解。我将通过本指南使事情尽可能的简单。


谷歌seo入门指南第六章:搜索引擎优化技术

Chapter 2

理解抓取

在本章中,我们将介绍如何确保搜索引擎能够有效地抓取你的内容。

抓取的工作原理

爬虫从页面抓取内容并使用这些页面上的链接来查找更多页面。这让他们可以在互联网上找到更多内容。这个过程中有一些机制需要讨论。

谷歌seo入门指南第六章:搜索引擎优化技术

来源:Google

URL 来源

爬虫必须从某个地方开始。通常,他们会创建一个列表,列出他们通过页面找到的所有 URL。另外一个机制就是通过用户或具有页面列表的各种系统创建的站点地图来查找更多 URL。

抓取队列

所有需要爬取或重新爬取的 URL 都会被安排优先级并加入到爬取队列中。这基本上是 Google 想要抓取的 URL 的有序列表。

爬虫

抓取页面内容的机制。

处理

这些是规范化的处理机制,渲染页面,就像浏览器加载页面一样,并处理页面以获取更多要抓取的 URL,我们后面会讨论这些机制。

渲染

渲染就是像浏览器一样加载页面,加载 JavaScript 和 CSS 文件。这样做是为了让 Google 可以看到大多数用户会看到的内容。

索引

用于储存 Google 向用户显示的页面。

抓取控制

有几种方法可以控制在你的网站上可被抓取的内容。

Robots.txt

Robots.txt 文件会告诉搜索引擎他们可以和不可以访问的页面。

需要说明的是,如果链接指向这些页面,即使 Google 不可以访问该页面,但也可能会将它们编入索引。这可能会令人困惑,但如果你想防止页面被索引,请查看本指南和流程图。

抓取频率

你可以在 robots.txt 中使用一个 crawl-delay 指令,许多抓取工具都支持该指令,你可以设置它们抓取页面的频率。不幸的是,谷歌并不支持。对于 Google,你需要按照此处所述在 Google Search Console 中更改抓取速度。.

访问限制

如果你希望某些用户可以访问该页面,但搜索引擎不能访问该页面,那么你可能想要的是以下三个情况之一:

  • 某些登录页面;
  • HTTP 认证 (需要密码才能访问的地方);
  • IP 白名单 (只允许特定的 IP 地址访问页面)

这种类型的设置最适用于内部网络、会员限定的内容、测试、或开发中的站点。它允许一组用户访问该页面,但搜索引擎将无法访问它们并且不会索引这些页面。

如何查看抓取活动

特别是对于 Google,查看他们正在抓取的内容的最简单方法是使用 Google Search Console 抓取统计报告,该报告为你提供有关抓取你网站的更多信息。

如果你想查看网站上的所有抓取活动,则需要访问服务器日志并需要使用工具来更好地分析数据。如果你的主机有一个像 cPanel 这样的控制面板,你应该可以通过一些工具例如 Awstats 和 Webalizer 访问原始日志。

谷歌seo入门指南第六章:搜索引擎优化技术

抓取调整

每个网站都有不同的抓取预算,这是 Google 抓取网站的频率以及你的网站允许抓取的数量的组合。更受欢迎的页面和经常更改的页面将被更频繁地抓取,而看起来不受欢迎或链接不多的页面抓取频率会比较低。

如果抓取工具在抓取网站时有压力,它们通常会减慢速度甚至停止抓取,直到条件改善。

页面被抓取后,它们会被渲染,然后送到索引。索引就是储存搜索结果的列表。

我们来谈谈指数。


谷歌seo入门指南第六章:搜索引擎优化技术

Chapter 3

理解索引

在本章中,我们将讨论如何确保你的页面被索引并检查它们是如何被索引的。

爬虫指令

爬虫标记是一个 HTML 片段,它告诉搜索引擎如何抓取或索引某个页面。它被放置在网页的 <head> 部分,如下所示:

<meta name=”robots” content=”noindex” />

规范化

当同一页面有多个版本时,Google 会选择一个存储在它们的索引中。此过程称为规范化,选择为规范的 URL 将是 Google 在搜索结果中显示的 URL。他们使用许多不同的信号来选择规范 URL,包括:

  • 规范标签
  • 重复页面
  • 内部链接
  • 跳转
  • 网站地图 URL

查看 Google 如何将页面编入索引的最简单方法是使用 Google Search Console 中的 URL 检查工具。它将显示 Google 选择的规范网址是什么。

谷歌seo入门指南第六章:搜索引擎优化技术

谷歌seo入门指南第六章:搜索引擎优化技术

Chapter 4

技术 SEO 速胜要素

对于 SEO 来说,最难的事情之一是确定优先级。有很多最佳做法,但有些变化会对你的排名和流量产生的影响比其他的更大。以下是我建议优先考虑的一些要素。

检查索引

确保你希望人们看到的页面已被 Google 编入索引。前两章讲了爬行和索引,目的就在于此。

你可以在 Site Audit(网站诊断)中查看可见度报告以查找无法编入索引的页面及其原因。这个报告在 Ahrefs Webmaster Tools(Ahrefs 站长工具)中是免费的。

谷歌seo入门指南第六章:搜索引擎优化技术

回收丢失的链接

网站运行期间,往往会更改其 URL。在许多情况下,这些旧 URL 包含来自其他网站的链接。如果它们没有被重定向到当前页面,那么这些链接就会丢失并且不再计入你的页面。通过重定向可以快速收回丢失的链接。这也是一个快速获取链接的技巧。

Site Explorer -> yourdomain.com -> Pages -> Best by Links -> add a “404 not found” HTTP response filter. I usually sort this by “Referring Domains”.

Site Explorer(网站分析) -> 你的域名 -> 页面 -> Best by Links(按反链数量排序) -> 添加“404 not found” HTTP 响应过滤器。我通常会按 Referring Domains(引用域)进行排序。

这是检测 1800flowers.com 网站的结果:

谷歌seo入门指南第六章:搜索引擎优化技术

在 archive.org 中查看第一个 URL,我看到这以前是关于母亲节页面。通过将该页面重定向到当前版本,你可以回收来自 59 个不同网站的 225 个链接,其他页面也有很多类似的情况。

你需要用 301 跳转,将旧 URL 重定向到当前页面以收回丢失的权重。

加入内链

内部链接是从你网站上的一个页面到你网站上另一个页面的链接。它们有助搜索引擎于找到你的页面,并帮助页面更好地排名。我们在 Site Audit(网站诊断)中有一个称为链接机会的报告,可帮助你快速找到这些机会。

添加架构标记

架构标记是一种代码,可帮助搜索引擎更好地理解你的内容,并提供许多功能,可帮助你的网站在搜索结果中脱颖而出。 谷歌的搜索库可以显示网站符合条件所需的各种搜索功能和架构。


谷歌seo入门指南第六章:搜索引擎优化技术

Chapter 5

附加技术要素

我们将在本章中讨论的要素都是值得关注的,但与上一章中的速胜要素相比,它们可能需要更多的工作并且收益更少。这并不意味着你不需要做,只是为了帮助你了解如何确定工作的优先级。

页面体验信号

这些是次要的排名因素,但为了你的用户,你仍然希望查看这些内容。它们涵盖了影响用户体验 (UX) 的网站方面。

谷歌seo入门指南第六章:搜索引擎优化技术

核心页面指标

核心页面指标是速度指标,是 Google 用于衡量用户体验的页面体验信号的一部分。这些指标测量是:最大内容绘制速度 (LCP)、累积布局偏移速度 (CLS) 、以及首次输入延迟时间 (FID) 。

HTTPS

HTTPS 保护你的浏览器和服务器之间的通信不被攻击者拦截和篡改。这为当今绝大多数互联网流量提供了机密性、完整性和身份验证。你更希望你的页面通过 HTTPS 而不是 HTTP 加载。

任何在地址栏中显示锁型图标的网站都在使用 HTTPS。

谷歌seo入门指南第六章:搜索引擎优化技术

移动友好

简而言之,这会检查网页是否正确显示并且是否可以被移动设备上的人们轻松使用。

你如何知道你的网站对移动设备的友好程度如何?检查 Google Search Console 中的 “移动可用性” 报告即可。

谷歌seo入门指南第六章:搜索引擎优化技术

此报告会告诉你网页是否存在移动友好性问题。

安全浏览

这些检查是为了确保页面没有欺骗性内容、不包含恶意软件、并且没有任何恶意下载。

插页式广告

插页式广告会阻止内容被看到。这些弹出窗口会阻碍用户阅读主要页面内容。

Hreflang — 用于多语言

Hreflang 是一个 HTML 属性,用于指定网页的语言和地理定位。如果你有不同语言的同一页面的多个版本,你可以使用 hreflang 标签将这些变体告知 Google 等搜索引擎。这有助于他们向用户提供正确的版本。

维护/网站健康

这些任务不太可能对你的排名产生太大影响,但通常是改善用户体验的好事情。

失效的链接

失效的链接是你网站上指向不存在资源的链接——这些链接可以是内部的(即指向你网站域中的其他页面),也可以是外部的(即指向其他网站中的页面)。

你可以使用 Site Audit(网站诊断)中的链接报告快速找到网站上的失效的链接。它 Ahrefs Webmaster Tools(Ahrefs 站长工具)中是免费的。

谷歌seo入门指南第六章:搜索引擎优化技术

重定向链

重定向链是发生在初始 URL 和目标 URL 之间的一系列重定向。

你可以使用 Site Audit(网站诊断)中的“重定向”报告快速找到重定向链。它 Ahrefs Webmaster Tools(Ahrefs 站长工具)中是免费的。

谷歌seo入门指南第六章:搜索引擎优化技术

谷歌seo入门指南第六章:搜索引擎优化技术

Chapter 6

技术 SEO 优化工具

这些工具可帮助你改进网站的 SEO 技术方面。

Google Search Console

谷歌seo入门指南第六章:搜索引擎优化技术

Google Search Console 是 Google 提供的一项免费服务,可帮助你监控网站在搜索结果中的表现并对其进行故障排除。

使用它来查找和修复技术错误、提交站点地图、查看结构化数据问题等。

Bing 和 Yandex 也有自己的工具,Ahrefs 也是如此。Ahrefs Webmaster Tools(Ahrefs 站长工具)是一款免费工具,可帮助你提高网站的 SEO 性能。它允许你:

  • 监控你网站的 SEO 健康状况
  • 检查 100 多个 SEO 问题
  • 查看所有反向链接
  • 查看你排名的所有关键词
  • 了解你的网页获得了多少流量
  • 寻找内部链接机会
  • 这是弥补了 Google Search Console 的局限性。

谷歌移动友好测试

谷歌seo入门指南第六章:搜索引擎优化技术

Google 的移动友好测试可检查访问者在移动设备上使用你的页面的难易程度。它还可以识别特定的移动可用性问题,例如文本太小而无法阅读、使用不兼容的插件等。

测试会显示 Google 在抓取页面时看到的内容。你还可以使用富搜索结果测试来查看 Google 在你的桌面或移动设备上看到的内容。

Chrome 开发者工具

谷歌seo入门指南第六章:搜索引擎优化技术

Chrome 开发者工具是 Chrome 的内置网页调试工具。使用它来调试页面速度问题、提高网页渲染性能等。

从技术 SEO 的角度来看,它有无穷无尽的用途。

Ahrefs Toolbar(Ahrefs SEO工具栏)

谷歌seo入门指南第六章:搜索引擎优化技术

Ahrefs SEO Toolbar (Ahrefs SEO工具栏)是支持 Chrome 和 Firefox 的免费扩展程序,可提供有关你访问的页面和网站的有用 SEO 数据。

它的免费功能是:

  • 页面SEO报告
  • 使用 HTTP 标头重定向跟踪器
  • 失效的链接查询
  • 链接高亮
  • SERP排位

此外,作为 Ahrefs 用户,你可以获得:

  • 你访问的每个网站和页面以及 Google 搜索结果的 SEO 指标
  • 在 SERP 中的关键词指标,例如搜索量和关键词难度
  • SERP结果报告导出

PageSpeed Insights

谷歌seo入门指南第六章:搜索引擎优化技术

PageSpeed Insights 分析网页的加载速度。除了性能得分外,它还显示了可操作的建议,以加快页面加载速度。

总结

所有这些只是技术 SEO 的皮毛。这应该可以帮助你了解基础知识,并且许多部分都有其他链接供你进一步深入了解。本指南中有未涵盖的主题,因此如果你想了解更多信息,我们也给你准备了一个清单。

具体重点

  • PDF SEO
  • 图片 SEO
  • JavaScript SEO

基础设施相关的

  • 状态代码
  • 重定向
  • HTTP/2/3
  • CDNs
  • 负载均衡
  • HTTP 标题

网站相关的

  • 页面速度
  • 加速移动页面 (AMP)
  • 渐进式网络应用程序(PWAs)
  • 移动版网址
  • 参数处理
  • 分面导航
  • 分页
  • 站点链接
  • 抓取预算
  • Edge SEO / serverless SEO
  • 移除网址
  • 网站结构
  • URLs

流程

  • 技术SEO审核
  • 迁移
  • 自动化 / python
  • Log file分析
  • SEO测试

其他

  • Regex
  • 用户代理

享受探索和学习的乐趣吧,有任何问题可以在 Twitter 上找我。

文章为作者独立观点,不代表站长派立场,本文链接:https://zhanzhangpai.com/?p=375

免责声明:本站部分内容来源互联网整理,如有侵权请联系站长删除。站长邮箱:1245911050@qq.com

(0)
上一篇 2022年1月11日 下午2:21
下一篇 2022年1月12日 上午9:51

相关推荐

  • 网站title优化原则?如何优化网站标题?

    Title是一个页面的核心,对页面进行优化时首先就是从Title开始的。在SEO中,Title的权重非常高,有没有描写好Title,有没有抓住关键词进行合理的描写,这都是需要不断研…

    2022年3月15日
  • 百度搜索基础展现解读

    一、什么是搜索基础展现? 用户在百度搜索引擎中根据自身的搜索需求输入关键词,从得到的搜索结果中,筛选出符合需求的内容,产生点击行为。这个过程中,【搜索展现】传递给用户的信息,会影响…

    2022年12月30日
  • 【SEO问答】现在是没有备案的网站不收录了吗?

    我就问一下,现在百度是对没有备案的网站采取不收录的政策了吗? 我自己搜出来的都是之前的回答说没有影响,但是我没有备案的站就是死活不收,蜘蛛只抓了1下就再也不来了,求大佬解答 站长1…

    2022年3月21日
  • 蓝天算法1.0详情

    百度持续打击新闻源售卖软文、目录行为,近日百度反作弊团队发现部分新闻源站点售卖目录,发布大量低质内容现象仍然存在,此举严重违反新闻源规则,并影响用户搜索体验。针对此情况,百度推出“…

    2022年2月8日
  • 网站优化注意事项

    在百度眼里,网站优化应该贯穿于从网站建设到上线内容补充更新的全过程,而不是独立存在的“事后”行为。优化不仅仅是SEO人员的事儿,只有技术人员、产品人员,包括编辑都拥有SEO意识和S…

    2022年12月30日
  • 网站索引量下降常见原因及解决方案

    索引量是流量的基础,索引量数据的每一个变动都拨动着站长敏感的神经,“索引量下降之后该如何着手分析”一直是各位讨论的热门话题。这次站长社区版主老吕又拔刀相助了,看看史上最全的百度索引…

    2022年12月30日
  • 【SEO问答】什么是优质内容?如何生产优质内容?

    【提问要求】: 1、问题不能是个例性的问题;具体的个例的站点问题请在搜索资源平台反馈中心进行反馈。 2、在本贴中只能提问“百度搜索优质内容”的相关问题。 3、请尽可能详细、清晰地描…

    2022年3月22日
  • 索引量和site数据的差别及含义,site结果和网站索引量一样吗?

    百度索引量是百度站长平台推出的查询网站真实索引量的工具。在第8章也会有所提及,这里配合site来讨论一下百度索引量的数据。百度在多个地方都在提醒site指令得到的“收录量”并不是真…

    2022年3月1日
  • 友情链接交换技巧:友情链接锚文本要多样化

    自然的链接,不可能所有链接的锚文本都是相应页面的核心关键词。为了使链接构建显得更加自然,应该设计多样化的锚文本。可以在一开始做友情链接交换的时候就设置几个核心的锚文本,多个核心关键…

    2022年3月19日
  • 搜索引擎是如何进行内容处理的?百度蜘蛛页面处理原理介绍

    内容处理即搜索引擎对Spider抓取回来的页面进行处理。处理步骤简单介绍如下。 步骤01要判断该页面的类型 首先要判断该页面的类型是普通网页,还是PDF、Word、Excel等特殊…

    2022年2月21日