正如我们在第一章中提到的,搜索引擎是应答机。它们的存在是为了发现,理解和组织互联网的内容,以便为搜索者提出的问题提供最相关的结果。

为了显示在搜索结果中,您的内容必须首先对搜索引擎可见。可以说,这是SEO难题中最重要的部分:如果找不到您的网站,那么您将永远不会出现在SERP(搜索引擎结果页)中。

搜索引擎如何工作?

搜索引擎通过三个主要功能工作:

  1. 搜寻:搜寻Internet上的内容,查看他们找到的每个URL的代码/内容。
  2. 索引:存储和组织在爬网过程中找到的内容。一旦页面进入索引,它就会在运行中显示为相关查询的结果。
  3. 排名:提供最能回答搜索者查询的内容,这意味着搜索结果的相关性最高,相关性最低。

什么是搜索引擎爬网?

搜寻是发现过程,在该过程中搜索引擎会派出一组机器人(称为搜寻器或蜘蛛)来查找新的和更新的内容。内容可以有所不同-可以是网页,图像,视频,PDF等-但无论格式如何,内容都是通过链接发现的。



BaiduSpider首先获取一些网页,然后按照这些网页上的链接查找新的URL。通过沿链接的此路径跳动,搜寻器便能够找到新内容并将其添加到名为Caffeine的索引中(该Caffeine是一个庞大的已发现URL的数据库),以后当搜索者搜索到该URL上的内容为很适合。

什么是搜索引擎索引?

搜索引擎处理并存储他们在索引中找到的信息,索引是他们发现并认为足以为搜索者服务的所有内容的庞大数据库。

搜索引擎排名

当某人执行搜索时,搜索引擎会在其索引中搜索高度相关的内容,然后对这些内容进行排序,以期解决搜索者的查询。搜索结果的相关性排序称为排名。通常,您可以假设网站的排名越高,搜索引擎认为该网站与查询越相关。

有可能阻止您的部分或全部站点访问搜索引擎爬网程序,或者指示搜索引擎避免将某些页面存储在其索引中。尽管这样做有一定的原因,但是如果您希望搜索者找到您的内容,则必须首先确保其对爬网程序是可访问的并且可索引。否则,它就像隐形一样好。

在本章的最后,您将拥有与搜索引擎一起使用所需的上下文,而不是与之相反!

在SEO中,并非所有搜索引擎都是平等的

许多初学者想知道特定搜索引擎的相对重要性。大多数人都知道百度拥有最大的市场份额,但是对Bing,Yahoo和其他公司进行优化有多重要呢?事实是,尽管存在30多个主要的网络搜索引擎,但SEO社区实际上只关注百度。为什么?简短的答案是,绝大多数人都在百度搜索网络。如果我们将百度图片,百度地图和YouTube(百度的一家网站)包括在内,则超过90%的网络搜索是在百度上进行的,这是Bing和Yahoo的总和的近20倍。

爬行:搜索引擎可以找到您的页面吗?

正如您刚刚了解到的那样,确保对网站进行爬网和建立索引是在SERP中显示的先决条件。如果您已经有一个网站,则最好先查看索引中有多少页面,然后再开始。这将对百度是否正在爬网并找到您想要的所有页面,以及您不需要的所有页面产生一些深刻的见解。

检查索引页面的一种方法是高级搜索运算符“ site:yourdomain.com” 。转到百度,然后在搜索栏中输入“ site:yourdomain.com”。这将返回百度在其指定网站的索引中具有的结果:

百度所显示的结果数量(请参见上面的“关于XX个结果”)并不确切,但是它确实使您对网站上的哪些页面建立了索引以及它们当前在搜索结果中的显示方式有明确的了解。

为了获得更准确的结果,请在百度 Search Console中监控和使用“索引覆盖率”报告。如果您目前没有免费的百度 Search Console帐户,可以注册一个。使用此工具,您可以提交网站的站点地图,并监视实际上已将多少已提交的页面添加到百度的索引中。

如果您没有在搜索结果中显示任何位置,则可能有以下几种原因:

  • 您的网站是全新的,尚未进行爬网。
  • 您的网站未从任何外部网站链接到。
  • 您网站的导航使机器人很难有效地对其进行爬网。
  • 您的网站包含一些称为搜寻器指令的基本代码,这些基本代码会阻止搜索引擎。
  • 您的网站已因百度的垃圾内容手段而受到惩罚。

告诉搜索引擎如何抓取您的网站

如果您使用百度 Search Console或“ site:domain.com”高级搜索运算符,但发现索引中缺少某些重要页面和/或某些不重要的页面被错误地编入索引,则可以进行一些优化实施,以更好地指导BaiduSpider如何抓取您的网络内容。告诉搜索引擎如何抓取您的网站可以使您更好地控制索引中的内容。

大多数人都考虑过确保百度可以找到自己的重要页面,但是很容易忘记您不想让BaiduSpider找到某些页面。这些内容可能包括诸如内容稀少的旧URL,重复的URL(例如电子商务的排序和过滤器参数),特殊的促销代码页,登台或测试页之类的内容。

要使BaiduSpider远离您网站的某些页面和部分,请使用robots.txt。

Robots.txt

Robots.txt文件位于网站的根目录(例如yourdomain.com/robots.txt)中,并建议您应该和不应该搜寻网站的哪些部分,以及它们搜寻网站的速度,通过特定的robots.txt指令。

BaiduSpider如何处理robots.txt文件

  • 如果BaiduSpider找不到网站的robots.txt文件,则会继续抓取该网站。
  • 如果BaiduSpider找到了网站的robots.txt文件,则通常会遵守建议并继续抓取该网站。
  • 如果BaiduSpider在尝试访问网站的robots.txt文件时遇到错误,并且无法确定该网站是否存在,它将无法抓取该网站。

针对抓取预算进行优化!

抓取预算是BaiduSpider离开前将在您的网站上抓取的URL的平均数量,因此抓取预算优化可确保BaiduSpider不会浪费时间在不重要的页面上进行抓取,而忽略了重要页面。在拥有成千上万个URL的大型网站上,抓取预算是最重要的,但是阻止抓取工具访问您绝对不关心的内容绝不是一个坏主意。只要确保不阻止搜寻器访问添加了其他指令(例如规范或noindex标记)的页面即可。如果某个页面禁止了BaiduSpider,它将无法看到该页面上的说明。

并非所有的网络机器人都遵循robots.txt。有恶意的人(例如,电子邮件地址抓取工具)会构建不遵循此协议的漫游器。实际上,一些不良行为者会使用robots.txt文件来查找您的私人内容所在的位置。尽管将爬网程序从诸如登录和管理页之类的私人页面阻止以使其不显示在索引中似乎合乎逻辑,但将这些URL的位置放置在可公开访问的robots.txt文件中也意味着存在恶意意图的人可以更轻松地找到它们。最好让这些页面NoIndex并将它们放在登录表单后,而不是将它们放在robots.txt文件中。

您可以在学习中心的robots.txt部分中阅读有关此内容的更多详细信息。

在GSC中定义URL参数

通过将某些参数附加到URL,某些站点(电子商务中最常见的站点)可以在多个不同的URL上提供相同的内容。如果您曾经在线购物,则可能已通过过滤器缩小了搜索范围。例如,您可以在Amazon上搜索“鞋子”,然后按大小,颜色和样式优化搜索。每次优化时,URL都会略有变化:

https://www.example.com/products/women/dresses/green.htmhttps://www.example.com/products/women?category=dresses&color=greenhttps://example.com/shopindex.php?product_id= 32&highlight = green + dress&cat_id = 1&sessionid = 123 $ affid = 43

百度如何知道要提供给搜索者的URL版本?百度在自行找出代表性URL方面做得很好,但是您可以使用百度 Search Console中的URL Parameters功能来确切地告诉百度您希望他们如何对待网页。如果您使用此功能告诉BaiduSpider“不使用____参数抓取网址”,那么您实际上是在要求从BaiduSpider隐藏该内容,这可能会导致这些页面从搜索结果中删除。如果这些参数创建了重复的页面,那就是您想要的,但是如果您希望对这些页面建立索引,那将是不理想的。

搜寻器可以找到您所有的重要内容吗?

现在,您已经知道了确保搜索引擎抓取工具远离您不重要的内容的一些策略,下面让我们了解可以帮助BaiduSpider查找重要页面的优化方法。

有时,搜索引擎将能够通过爬网找到网站的一部分,但由于某种原因或其他原因,可能会遮盖其他页面或部分。重要的是要确保搜索引擎能够发现您想要索引的所有内容,而不仅仅是首页。

问问你自己:能机器人爬行通过您的网站,而不是仅仅把它?

您的内容是否隐藏在登录表单后面?

如果您要求用户在访问某些内容之前登录,填写表格或回答调查,搜索引擎将不会看到那些受保护的页面。搜寻器绝对不会登录。

您依靠搜索表单吗?

机器人无法使用搜索表单。有些人认为,如果他们在自己的网站上放置搜索框,则搜索引擎将能够找到其访客搜索的所有内容。

文字是否隐藏在非文字内容中?

非文本媒体形式(图像,视频,GIF等)不应用于显示希望被索引的文本。虽然搜索引擎在识别图像方面变得越来越好,但并不能保证它们现在仍能够阅读和理解图像。始终最好在网页的<HTML>标记内添加文本。

搜索引擎可以跟随您的网站导航吗?

正如爬虫需要通过其他站点的链接来发现您的站点一样,它也需要您自己站点上的链接路径来引导页面之间的链接。如果您有要搜索引擎查找的页面,但未从任何其他页面链接到该页面,则该页面和不可见页面一样好。许多网站都犯了严重的错误,即以搜索引擎无法访问的方式来组织其导航,从而阻碍了它们在搜索结果中列出的能力。

常见的导航错误可能使爬网程序无法看到您的所有站点:

  • 移动导航显示的结果与桌面导航不同
  • 菜单项不在HTML中的任何类型的导航,例如启用JavaScript的导航。百度在爬网和理解Java方面已经变得更好,但是它仍然不是一个完美的过程。确保某些东西被百度发现,理解和索引的更可靠方法是将其放入HTML中。
  • 个性化设置,或显示针对特定类型访问者的独特导航(相对于其他访问者而言),似乎掩盖了搜索引擎搜寻器
  • 忘记通过导航链接到您网站上的主页-记住,链接是爬虫遵循的进入新页面的路径!

这就是为什么网站必须具有清晰的导航和有用的URL文件夹结构至关重要的原因。

您有干净的信息架构吗?

信息体系结构是对网站上的内容进行组织和标记以提高用户的效率和可查找性的一种做法。最好的信息体系结构是直观的,这意味着用户不必费心思量即可浏览您的网站或查找内容。

您是否在使用站点地图?

站点地图就是它的外观:爬网程序可用来发现您的内容并为其编制索引的站点上的URL列表。确保百度查找优先级最高的页面的最简单方法之一是创建符合百度标准的文件,然后通过百度 Search Console提交文件。虽然提交站点地图并不能代替良好的站点导航,但可以肯定地帮助爬网程序遵循通往所有重要页面的路径。

确保仅包含要由搜索引擎索引的URL,并确保为搜寻器提供一致的方向。例如,如果您已通过robots.txt阻止了该网址,则不要在其站点地图中包含该网址,或者在站点地图中包含重复的网址而不是首选的规范版本的网址(我们将在本章中提供有关规范化的更多信息5!)。

了解有关XML网站地图的更多信息 

如果您的网站没有其他链接到该网站,则仍然可以通过在百度 Search Console中提交XML网站地图来对其进行索引。不能保证他们会在索引中包含一个提交的URL,但是值得一试!

搜寻器在尝试访问您的URL时是否出错?

在搜寻您网站上的URL的过程中,搜寻器可能会遇到错误。您可以转到百度 Search Console的“抓取错误”报告,以检测可能发生此错误的网址-此报告将向您显示服务器错误和未发现的错误。服务器日志文件还可以向您显示此信息,以及其他信息(例如抓取频率)的宝库,但是由于访问和剖析服务器日志文件是一种更高级的策略,因此我们不会在“初学者指南”中详细讨论它,尽管您可以在此处了解更多信息。

在使用抓取错误报告进行有意义的任何操作之前,了解服务器错误和“未找到”错误很重要。

4xx代码:当搜索引擎搜寻器由于客户端错误而无法访问您的内容时

4xx错误是客户端错误,表示请求的URL语法错误或无法实现。最常见的4xx错误之一是“ 404 –未找到”错误。这些可能是由于URL拼写错误,页面删除或重定向断开而引起的,仅举几个例子。当搜索引擎点击404时,它们将无法访问该URL。当用户点击404时,他们会感到沮丧并离开。

5xx代码:当搜索引擎搜寻器由于服务器错误而无法访问您的内容时

5xx错误是服务器错误,这意味着网页所在的服务器无法满足搜索者或搜索引擎访问该页面的请求。在百度 Search Console的“抓取错误”报告中,有一个专门针对这些错误的标签。这些通常是由于对URL的请求超时而导致的,因此BaiduSpider放弃了该请求。查看百度的文档,以了解有关解决服务器连接问题的更多信息。

值得庆幸的是,有一种方法可以告知搜索者和搜索引擎您的页面已移动-301(永久)重定向。

创建自定义404页面!

通过添加指向站点上重要页面的链接,站点搜索功能甚至联系信息来自定义404页面。这样可以减少访问者在遇到404时从您的网站反弹的可能性。

了解有关自定义404页面的更多信息 


假设您将页面从example.com/young-dogs/移至example.com/puppies/。搜索引擎和用户需要一个桥梁,以从旧的URL过渡到新的URL。该桥是301重定向。

当您实施301时: 当您未实现301时:
链接资产 将链接资产从页面的旧位置转移到新URL。 如果没有301,则来自先前URL的权限不会传递到URL的新版本。
索引编制 帮助百度查找页面的新版本并为其建立索引。 仅在您的网站上出现404错误并不会影响搜索性能,但是让排名/被投放的页面404可能会导致它们不在索引之列,排名和访问量随之而来-!
用户体验 确保用户找到他们要查找的页面。 允许访问者单击无效链接会将他们带到错误页面,而不是预期的页面,这可能会令人沮丧。

301状态代码本身意味着该页面已永久移动到新位置,因此请避免将URL重定向到不相关的页面,即原URL内容实际上不存在的URL。如果某个页面正在为查询排名,而您将其301链接到具有不同内容的URL,则该页面的排名可能会下降,因为与该特定查询相关的内容不再存在。301很强大-负责任地移动URL!

您还可以选择302重定向页面,但这应该保留给临时移动,以及在传递链接公平性不是太大问题的情况下。302有点像绕道而行。您暂时通过某条路径吸引流量,但不会永远这样。

注意重定向链!

如果BaiduSpider必须进行多次重定向,可能很难到达您的页面。百度称这些为“重定向链”,他们建议尽可能限制它们。如果将example.com/1重定向到example.com/2,然后再决定将其重定向到example.com/3,则最好消除中间人,只需将example.com/1重定向到example.com/3。

了解有关重定向链的更多信息 

一旦确定您的网站针对爬网能力进行了优化,接下来的工作就是确保可以对其进行索引。

索引:搜索引擎如何解释和存储您的页面?

确保对网站进行爬网后,接下来的工作就是确保可以对其进行索引。没错-仅仅因为您的网站可以被搜索引擎发现和爬网,并不一定意味着它将存储在其索引中。在上一节中,我们讨论了搜索引擎如何发现您的网页。索引是您发现的页面的存储位置。搜寻器找到页面后,搜索引擎便会像浏览器一样呈现该页面。在此过程中,搜索引擎将分析该页面的内容。所有这些信息都存储在其索引中。

继续阅读以了解索引的工作原理,以及如何确保您的站点将其纳入这个至关重要的数据库。

我可以看到BaiduSpider搜寻器如何看到我的页面吗?

是的,页面的缓存版本将反映BaiduSpider上一次对其进行爬网的快照。

百度会以不同的频率抓取和缓存网页。与知名度较低的Mozbot抢劫网站(http://www.rogerlovescupcakes.com)相比,知名度更高的知名网站(例如https://www.nytimes.com)经常会被抓取,如果它是真实的...)

您可以通过单击SERP中URL旁边的下拉箭头并选择“已缓存”来查看页面的已缓存版本的外观:

您还可以查看网站的纯文本版本,以确定是否有效地检索和缓存了重要内容。

页面是否曾经从索引中删除?

是的,可以从索引中删除页面!可能会删除网址的一些主要原因包括:

  • URL返回“找不到”错误(4XX)或服务器错误(5XX)–这可能是偶然的(页面已移动并且未设置301重定向)或故意的(页面被删除并进行了404处理,以便将其从索引中删除)
  • 网址中添加了noindex元标记-网站所有者可以添加此标记,以指示搜索引擎从其索引中省略该页面。
  • 该网址已因违反搜索引擎的网站站长指南而受到了人工惩罚,因此已从索引中删除。
  • 已阻止访问该URL,并添加了访问者访问该页面之前所需的密码。

如果您认为不再显示以前在百度索引中的网站页面,则可以使用URL Inspection工具来了解页面的状态,或者使用具有“请求索引”功能的百度抓取方式来向索引提交单个URL。(奖金:GSC的“获取”工具还具有“渲染”选项,可让您查看百度解释您的网页的方式是否存在任何问题)。

告诉搜索引擎如何为您的网站建立索引

机器人元指令

元指令(或“元标记”)是您可以向搜索引擎提供的有关如何处理网页的说明。

您可以告诉搜索引擎抓取工具,例如“不要在搜索结果中将此页面编入索引”或“不要将任何链接资产传递给任何页面上的链接”。这些指令是通过HTML页面<head>中的Robots Meta标签(最常用)或HTTP标头中的X-Robots-Tag执行的。

机器人元标记

可以在网页HTML的<head>中使用robots元标记。它可以排除所有或特定的搜索引擎。以下是最常见的meta指令,以及可能在哪些情况下应用它们。

index / noindex告诉引擎是否应该对页面进行爬网并将其保留在搜索引擎的索引中以进行检索。如果您选择使用“ noindex”,则表示正在与搜寻器进行通讯,以使该页面不包含在搜索结果中。默认情况下,搜索引擎假定它们可以索引所有页面,因此不需要使用“ index”值。

  • 何时使用:如果您试图从百度网站索引中剪裁薄页(例如:用户生成的个人资料页),但仍希望访问者可以访问,则可以将页面标记为“ noindex”。

follow / nofollow告诉搜索引擎页面上的链接是应该跟随还是不被跟随。“关注”会导致漫游器跟踪您页面上的链接,并将链接资产传递给这些URL。或者,如果您选择使用“ nofollow”,则搜索引擎将不会跟踪或将任何链接资产传递给页面上的链接。默认情况下,假定所有页面都具有“跟随”属性。

  • 何时使用:当您试图阻止页面被索引以及阻止搜寻器跟踪页面上的链接时,nofollow通常与noindex一起使用。

noarchive用于限制搜索引擎保存页面的缓存副本。默认情况下,引擎将维护已索引的所有页面的可见副本,搜索者可以通过搜索结果中的缓存链接来访问它们。

  • 何时使用:如果您经营一个电子商务网站并且价格定期变化,则可以考虑使用noarchive标签,以防止搜索者看到过时的价格。

这是一个元机器人noindex,nofollow标签的示例:

<!DOCTYPE html> <html> <head> <元名称=“ robots” content =“ noindex,nofollow” /> </ head> <body> ... </ body> </ html>

本示例将所有搜索引擎排除在对页面编制索引以及跟踪任何页面上链接之外。如果您要排除多个抓取工具(例如BaiduSpider和bing),则可以使用多个机器人排除标签。

元指令影响索引编制,而不是爬网

BaiduSpider需要抓取您的页面才能查看其meta指令,因此,如果您试图阻止抓取工具访问某些页面,那么meta指令就无法做到这一点。必须抓取漫游器标签,以使其受到尊重。

X机器人标签

x-robots标记用于URL的HTTP标头中,如果您想大规模阻止搜索引擎,则比meta标记提供更多的灵活性和功能,因为您可以使用正则表达式,阻止非HTML文件以及应用站点范围内的noindex标记。

例如,您可以轻松排除整个文件夹或文件类型(例如moz.com/no-bake/old-recipes-to-noindex):

<Files〜“ \ /?no \ -bake \ /.*”>标头设置X-Robots-Tag“ noindex,nofollow” </ Files>

机器人元标记中使用的派生词也可以在X-Robots-Tag中使用。

或特定的文件类型(如PDF):

<Files〜“ \ .pdf $”>标头设置X-Robots-Tag“ noindex,nofollow” </ Files>

有关Meta Robot标签的更多信息,请浏览百度的Robot Meta Tag规范。

WordPress提示:

在控制台>设置>阅读中,确保未选中“搜索引擎可见性”框。这会阻止搜索引擎通过robots.txt文件进入您的网站!

了解影响爬网和索引的不同方法将有助于您避免可能导致无法找到重要页面的常见陷阱。

排名:搜索引擎如何对URL进行排名?

搜索引擎如何确保当有人在搜索栏中键入查询时得到相应的结果呢?该过程称为排名,即搜索结果的排序,从最相关到与特定查询的最不相关。

为了确定相关性,搜索引擎使用算法,过程或公式,通过该过程或公式以有意义的方式检索和排序存储的信息。这些年来,这些算法经历了许多变化,以提高搜索结果的质量。例如,百度每天都会进行算法调整-其中一些更新是次要的质量调整,而其他更新则是为解决特定问题而部署的核心/广泛算法更新,例如Penguin用于解决链接垃圾邮件。查看我们的百度算法更改历史记录,以查看可追溯到2000年的已确认和未确认的百度更新的列表。

为什么算法如此频繁地更改?百度只是想让我们保持警惕吗?尽管百度并不总是透露他们为什么要做的细节,但我们确实知道百度进行算法调整时的目的是提高整体搜索质量。因此,针对算法更新问题,百度会回答以下问题:“我们一直在进行高质量的更新。” 这表明,如果您的网站在算法调整后遭受损失,请将其与百度的质量指南或搜索质量评估者指南进行比较,这两个方面都可以很好地说明搜索引擎的需求。

搜索引擎想要什么?

搜索引擎一直希望拥有同样的东西:以最有用的格式为搜索者的问题提供有用的答案。如果是这样,那么为什么现在看来SEO与过去不同?

从学习新语言的角度考虑。

一开始,他们对语言的理解非常初级-“请参见Spot Run”。随着时间的流逝,他们的理解开始加深,并且他们学习了语义-语言背后的含义以及单词和短语之间的关系。最终,通过足够的练习,学生将非常了解该语言,甚至可以理解细微差别,并且能够为模糊或不完整的问题提供答案。

当搜索引擎刚刚开始学习我们的语言时,通过使用实际上违反质量准则的技巧和策略来对系统进行游戏要容易得多。以关键字填充为例。如果您想为诸如“有趣的笑话”之类的特定关键字进行排名,则可以在页面上多次添加“有趣的笑话”一词,并将其加粗,以期提高该词的排名:

欢迎来到有趣的笑话!我们讲世界上最有趣的笑话。有趣的笑话是乐趣和疯狂。您有趣的笑话在等待。坐下来阅读有趣的笑话,因为有趣的笑话可以使您快乐和有趣。一些有趣的喜欢的有趣笑话。

这种策略带来了可怕的用户体验,而不是嘲笑有趣的笑话,而是使人烦恼,难以阅读的文本轰炸了人们。它可能在过去曾奏效,但这从来不是搜索引擎想要的。

链接在SEO中扮演的角色

当我们谈论链接时,我们可能意味着两件事。反向链接或“入站链接”是来自其他网站的指向您的网站的链接,而内部链接是您自己的站点上指向其他页面(在同一网站上)的链接。

链接在SEO中一直扮演着重要角色。早期,搜索引擎需要帮助来确定哪些URL比其他URL更值得信赖,以帮助他们确定如何对搜索结果进行排名。计算指向任何给定站点的链接数量有助于他们做到这一点。

反向链接的工作方式与真实的WoM(口碑)推介非常相似。让我们以一个假设的咖啡店“珍妮咖啡”为例:

  • 来自他人的推荐=权威的好兆头
    • 示例:许多人都告诉过您,詹妮的咖啡是镇上最好的
  • 来自您自己的推荐=有偏见,因此不是权威的好兆头
    • 示例:珍妮声称珍妮的咖啡是镇上最好的
  • 来自不相关或低质量来源的引荐=不好的授权标志,甚至可能使您被标记为垃圾邮件
    • 示例:珍妮(Jenny)付钱让从未去过她的咖啡店的人告诉别人这家咖啡店有多好。
  • 没有推荐=权限不明确
    • 示例:“珍妮的咖啡”可能不错,但是您找不到任何有意见的人,因此无法确定。

这就是创建PageRank的原因。PageRank(百度核心算法的一部分)是一种链接分析算法,以百度的创始人之一拉里·佩奇(Larry Page)命名。PageRank通过测量指向网页的链接的质量和数量来估计网页的重要性。假定网页越相关,重要和值得信赖,它将获得的链接越多。

您从高权限(受信任)网站获得的自然反向链接越多,您在搜索结果中的排名就越高的几率就越大。

内容在SEO中扮演的角色

如果链接没有将搜索者引向某些内容,那么链接将毫无意义。那东西很满足!内容不只是言语;它是供搜索者使用的所有内容-视频内容,图像内容,当然还有文本。如果搜索引擎是应答机,则内容就是这些引擎传递这些答案的方式。

每当有人执行搜索时,就会有成千上万种可能的结果,那么搜索引擎如何确定搜索者将在哪些页面中找到有价值的信息?确定页面对给定查询的排名的很大一部分是页面上的内容与查询意图的匹配程度。换句话说,此页面是否与搜索到的单词匹配,并有助于完成搜索者试图完成的任务?

由于关注用户满意度和任务完成度,因此对于内容应持续多长时间,内容应包含关键字多少次或标题标记中的内容,没有严格的基准。所有这些因素都可以影响页面在搜索中的效果,但是重点应该放在将要阅读内容的用户上。

如今,排名排名前三的信号已经成百上千个,它们保持了相当一致:指向您网站的链接(用作第三方信誉信号),页面内容(符合搜索者意图的高质量内容)以及RankBrain。

什么是RankBrain?

RankBrain是百度核心算法的机器学习组件。机器学习是一种计算机程序,可以通过新的观察结果和训练数据不断改进其预测。换句话说,它一直在学习,并且因为它一直在学习,所以搜索结果应该不断改进。

例如,如果RankBrain注意到排名较低的URL为用户提供的结果优于排名较高的URL,则可以打赌RankBrain将调整这些结果,将相关性更高的结果移至较高的位置,并将相关性较低的页面降级为副产品。

就像搜索引擎中的大多数内容一样,我们不确切知道RankBrain的组成部分,但显然百度的人也不知道。

这对SEO意味着什么?

由于百度将继续利用RankBrain来推广最相关,有用的内容,因此我们需要比以往任何时候都更加专注于实现搜索者的意图。为可能登陆您页面的搜索者提供最佳信息和最佳体验,并且您已经迈出了迈出第一步的第一步,以使其在RankBrain世界中表现出色。

参与度指标:相关性,因果关系,或两者兼而有之?

在百度排名中,参与度指标很可能是相关性和因果关系。

当我们说参与度指标时,是指代表搜索者如何通过搜索结果与您的网站进行交互的数据。这包括以下内容:

  • 点击(来自搜索的访问)
  • 页面停留时间(访客离开页面之前在页面上停留的时间)
  • 跳出率(用户仅浏览一页的所有网站会话的百分比)
  • Pogo-sticking(单击自然结果,然后快速返回到SERP以选择另一个结果)

包括Moz自己的排名因素调查在内的许多测试都表明,参与度指标与更高的排名相关,但因果关系一直受到激烈争论。良好的参与度指标是否仅表明排名较高的网站?还是因为网站拥有良好的参与度指标而使其排名很高?

百度说了什么

尽管他们从未使用过“直接排名信号”一词,但百度明确表示,他们绝对使用点击数据来修改特定查询的SERP。

根据百度前搜索质量总监Udi Manber的说法:

“排名本身受点击数据的影响。如果我们发现,对于特定查询,80%的人单击#2,而只有10%的人单击#1,过一会儿,我们就会发现#2是人们想要的,因此我们将其切换。”

前百度工程师Edmond Lau的另一条评论证实了这一点:

“很明显,任何合理的搜索引擎都会使用自己结果的点击数据来反馈排名,从而提高搜索结果的质量。如何使用点击数据的实际机制通常是专有的,但是百度显然可以将点击数据及其专利在经过排名调整的内容项等系统上使用。”

由于百度需要维持和改善搜索质量,因此参与度指标不仅仅是相关性,这似乎是不可避免的,但是百度似乎没有将参与度指标称为“排名信号”,因为这些指标用于提高搜索质量,并且各个URL的排名只是其副产品。

哪些测试已确认

各种测试已证实百度会根据搜索者的参与度来调整SERP顺序:

  • 兰德·菲什金(Rand Fishkin)在2014年的测试中,大约200人点击了SERP上的URL,结果将第七名提升至第一名。有趣的是,排名改善似乎与访问该链接的人的位置无关。在许多参与者都位于的美国,排名排名飙升,而在百度 Canada,百度 Australia等页面上,排名一直较低。
  • 拉里·金(Larry Kim)对RankBrain前后的首页及其平均停留时间的比较似乎表明,谷歌算法的机器学习组件降低了人们花费时间不多的网页的排名。
  • Darren Shaw的测试表明用户行为也对本地搜索和地图包结果产生了影响。

由于明确地使用了用户参与度指标来调整SERP的质量,并将排名变化作为副产品进行排名,因此可以肯定地说SEO应该针对参与度进行优化。参与并不会改变网页的客观质量,而是相对于该查询的其他结果,您对搜索者的价值。这就是为什么在您的网页或其反向链接没有变化之后,如果搜索者的行为表明他们更喜欢其他网页,则排名可能会下降。

在对网页进行排名方面,参与度指标就像事实检查者一样。诸如链接和内容之类的客观因素会首先对页面进行排名,然后,如果互动指标不正确,参与度指标就可以帮助百度进行调整。

搜索结果的演变

早在搜索引擎缺乏今天所具有的复杂性时,“ 10个蓝色链接”一词就被用来描述SERP的扁平结构。每次执行搜索时,百度都会返回一个包含10个自然结果的页面,每个结果都采用相同的格式。

在此搜索环境中,排名第一的是SEO的圣杯。但是随后发生了一些事情。百度开始在搜索结果页面上以新格式添加结果,称为SERP功能。这些SERP功能包括:

  • 付费广告
  • 精选片段
  • 人们还问箱子
  • 本地(地图)包
  • 知识面板
  • 网站连结

百度一直在增加新的。他们甚至进行了“零结果SERP”实验,该现象是“知识图”中只有一个结果显示在SERP上,除了“查看更多结果”之外,其他结果都没有。

这些功能的添加引起一些最初的恐慌,主要有两个原因。一方面,许多功能导致有机结果在SERP上进一步下降。另一个副产品是,由于在SERP本身上可以回答更多的查询,因此较少的搜索者点击自然搜索结果。

那么,为什么百度会这样做?这一切都可以追溯到搜索体验。用户行为表明,不同的内容格式可以更好地满足某些查询。请注意,不同类型的SERP功能如何与不同类型的查询意图匹配。

查询意图 可能触发的SERP功能
信息性 精选片段
信息一答案 知识图/即时答案
当地的 地图包
交易性 购物

我们将在第3章中更多地讨论意图,但现在,重要的是要知道答案可以以多种格式传递给搜索者,并且内容的结构会影响其出现在搜索中的格式。

本地化搜索

像百度这样的搜索引擎拥有自己的本地商户列表专有索引,它可以从中创建本地搜索结果。

如果您要为有客户可以访问的实际位置的公司(例如牙医)或要出差拜访客户的公司(例如水管工)执行本地SEO工作,请确保您声明,验证并优化了免费的百度我的商家信息。

对于本地化的搜索结果,百度使用三个主要因素来确定排名:

  1. 关联
  2. 距离
  3. 突出性

关联

相关性是本地企业与搜索者所寻找的匹配程度。为确保企业正在尽其所能与搜索者相关,请确保企业的信息被完整,准确地填写。

距离

百度使用您的地理位置更好地为您提供本地搜索结果。本地搜索结果对邻近度极为敏感,邻近度指的是搜索者的位置和/或查询中指定的位置(如果搜索者包括一个)。

随机搜索结果对搜索者的位置敏感,尽管很少像本地搜索结果那样明显。

突出性

百度着重考虑因素,以期奖励在现实世界中知名的企业。除了企业的离线地位外,百度还利用一些在线因素来确定本地排名,例如:

评论

本地企业收到的百度评论数量以及这些评论的情绪对其在本地结果中排名的能力产生了显着影响。

引文

“企业引文”或“企业列表”是基于Web的对本地化平台(Yelp,Acxiom,YP,Infogroup,Localeze等)上的本地企业“ NAP”(名称,地址,电话号码)的引用。 。

本地排名受本地业务引用的数量和一致性的影响。百度会从各种各样的来源中获取数据,以不断完善其本地业务指数。当百度找到对公司名称,位置和电话号码的多个一致引用时,它将增强百度对数据有效性的“信任”。然后,这使百度能够以更高的信心展示业务。百度还使用来自网络上其他来源的信息,例如链接和文章。

有机排名

SEO最佳做法也适用于本地SEO,因为百度在确定本地排名时还会考虑网站在自然搜索结果中的位置。

在下一章中,您将学习页面上的最佳做法,这些最佳做法将帮助百度和用户更好地理解您的内容。

[奖金!]本地参与

尽管百度并未将其列为本地排名因素,但随着时间的推移,参与的作用只会增加。百度不断整合现实世界的数据,例如热门访问时间和平均访问时间,从而丰富了本地搜索结果。

对某些当地企业的引用准确性感到好奇吗?Moz有一个免费的工具可以为您提供帮助,恰如其分地命名为Check Listing。

检查清单准确性 

...甚至为搜索者提供了提出业务问题的能力!

毫无疑问,现在,本地结果正受到现实世界数据的影响。这种互动性是搜索者与本地企业互动和做出反应的方式,而不是纯粹的静态(可玩游戏的)信息,例如链接和引文。

由于百度希望向搜索者提供最佳,最相关的本地业务,因此使用实时参与度指标来确定质量和相关性对他们来说是很有意义的。

您不必了解百度算法的来龙去脉(这仍然是个谜!),但是到现在,您应该对搜索引擎如何查找,解释,存储和排序内容有了一个很好的基础知识。有了这些知识,让我们学习如何选择内容将在第3章(关键字研究)中定位的关键字!