这是2021 年 11 月 5 日与约翰·穆勒( John Mueller)的Google SEO 办公时间最有趣的问题和答案的摘要。
垃圾反向链接与核心更新
00:47 “我们在瑞士拥有三个在线药店。[…] 对于 [其中一个],我们收到了很多垃圾反向链接。[…] 据我所知,通常 Google 可以管理这些类型的反向链接,但是在 7 月 Google 核心更新之后,我们的可见度受到了严重影响,特别是对于我们收到垃圾反向链接的 [一个] 商店。[…] 我想得到你的建议——我们可以做些什么来解决我们遇到的技术问题。到目前为止,我仍然相信这是由于垃圾邮件反向链接而发生的,但 [我] 不确定。”
John 说:“总的来说,对于核心更新,如果您看到那里的变化,通常,这与试图弄清楚网站的整体相关性更相关,而与垃圾链接等内容的相关性较小。在这种情况下,我不希望在基于进入您网站的随机垃圾邮件链接的核心更新中出现任何反应。
此外,通过核心更新,您可以随着时间的推移进行增量更改以改善您的网站的整体质量,这将在那里逐步提供帮助,但如果核心更新确实是一个非常强大的调整,那么您可能需要等待直到下一次核心更新才能看到这些变化。[…] 我们试图弄清楚网站的整体相关性是什么,而这几乎取决于整个网站的质量。
我想如果您有多个非常相似的商店,这会很棘手。[…] 其中一个可能不是坏的——其他的真的很好。但它可能仍然是您可以使用用户研究来弄清楚您可以做什么 […] 来明确该网站特别相关的东西。我认为,尤其是对于像药店这样的网站,我们的算法可能会尝试更加严格一些。[…] 这不是一个有故事和有趣图片的随机网站,它就像涉及人们的健康。“
John 补充说:“特别是关于 404 页和与核心更新无关的技术问题。核心更新更多是关于了解您网站的整体质量及其相关性,而不是技术问题和垃圾邮件。”
JavaScript 内容索引
05:11 “我在一个网站 […] 为 Core Web Vitals 工作。我们有一个功能,我们将 Youtube 视频放在顶部,从而成为 LCP 元素。它比我们刚刚拥有的要重,就像普通图像一样。所以我们正在尝试一种动态注入它的方法。[…] 由于它不在折叠内容的下方,所以我们不会延迟加载它,而是使用了外观,然后当用户单击播放按钮时动态注入 <iframe>。我现在意识到文章基本上没有与页面上的视频内容一起编入索引,所以如果我搜索页面并转到视频搜索,它不会出现在那里。所以我想知道将内容编入页面索引的最佳方式是什么。[…] 像 <noscript> 或结构化数据这样的方法吗?对此有什么最佳实践吗?”
约翰:“取决于你在那里设置立面的方式,你点击一个图像或一个 <div>,然后它在后台加载视频,可能是我们没有的情况”当我们查看页面时,它会自动将其作为视频选择。我从视频搜索团队那里得到反馈,告诉我们我们不应该告诉人们这样做,因为它会导致类似的问题。本质上,最好的方法是确保使用结构化数据,我们可以判断那里仍然存在视频。我相信您可以添加一种专门用于视频的结构化数据。视频站点地图在这方面基本上非常相似,因为您在此页面上告诉我们有一个相关的视频。所以这是那里的两种方法。
我怀疑随着时间的推移,Youtube 嵌入会变得越来越好,越来越快,而且你必须做这些技巧的问题会减少。但我认为目前,它仍然有意义,它仍然可以对页面的 Core Web Vitals 产生很大的影响。所以从这个角度来说,我很崩溃。如果视频团队告诉我你应该直接放它,而另一个团队说你应该快速制作,那么很难找到中间立场。但我认为至少确保我们可以识别视频在那里,这真的很重要。”
分类页面
13:35 “我们销售 […] 金属型材,我们有许多不同类型的这些型材。我们有很多精简的内容,因为我们有相同的变化。[…] 我们在这些 URL 中有数千个变体 […],我不知道如何处理。我应该规范化那些吗?但话又说回来,我们正在链接到它们 [这些 URL],所以我不想在我的页面内创建不良的内链或不良质量的链接。我应该不索引 [这些 URL] 还是阻止机器人访问 [它们]?[…] 我们不需要人们访问这些变体页面。我们只想在类别页面上创造良好的质量。”
约翰回答说:“通常我们的建议是,如果您希望以独特的方式找到独特的商品,那么您要确保为它们提供独特的 URL,并确保它们是规范的 [并且] 它们”没有被 noindex 阻止。但是,如果您不关心那些单独的 URL,如果您更关心更高级别的类别,或者如果您有更广泛的产品或类别之类的东西,它们本质上是查找内容的最重要方式,那么您可以规范化到该页面,如果需要,您可以不索引其他版本。因此,您基本上可以在那里做任何您想做的事情,以便我们将所有信号集中在您关心的主页上。
[…] 我想像你提到的工业产品,你有这么多不同的尺寸和变化,专注于总体布局并说所有这些不同的选项本质上都是主要产品的一个属性,我们应该只专注于主要产品。”
约翰补充说,“设置规范页面要记住的是,我们将尝试为您提到的规范页面建立索引。因此,如果非规范页面上有任何独特之处,那么我们将无法找到它,因此本质上任何重要的东西——确保它也在规范页面上被提及。”
在 Google Discover 中的排名
18:31 “在 Discover 中,我们或多或少有两个不同的搜索结果页面。我们有第一页,然后你可以点击更多结果,然后你有第二页。这是否涉及任何排名,以至于某些文章在第二页上,还是更新时间更多?”
约翰说:“可能有一种排名感,但我认为这与传统的网络排名不同。发现是如此个性化,所以我认为拥有传统概念是没有意义的,哦,你打开了一个发现页面,你是第五名,也许下次你是第四名或什么的像那样。[…]
甚至个性化排名方面也有很多事情要做。我想地理定位和不同格式的网页也有不同的方面,更多的视频或更少的视频,更多的图像——更少的图像。但老实说,我不知道[这是]具体是什么。”
约翰还建议遵循谷歌的建议,并补充说,“特别要注意我们所说的不要这样做或那种事情的方面。我也会在 Twitter 上从外部环顾四周——有少数人几乎专门研究 Discover。[…] 我会检查这些东西,但因为从我们的角度来看,这是一个如此个性化的提要,并不是说你可以努力提高你在那里的排名。这不是人们正在搜索的关键字。所以这很好,这里有一些我们认为可能有趣的东西给你。”
301 重定向
22:23 “我知道你应该使用 301 进行永久重定向,以尽可能最好和最快的方式通过 PageRank。但是,我们的开发团队不喜欢实现 301,因为它们存储在浏览器中,可能永远存在。他们说,如果重定向配置错误,人们可能永远无法丢失不正确的 301 重定向。Google 是否会像某些浏览器那样存储 301 重定向?”
根据约翰的说法,“整个爬行和索引系统与浏览器有着本质的不同,因为浏览器的所有网络方面都针对不同的事物进行了优化。在浏览器中,缓存内容更有意义,缓存时间更长。但本质上,从我们的角度来看,在抓取和索引方面 […],我们不会将抓取和索引视为浏览器。从某种意义上说,我们像浏览器一样呈现页面有点奇怪,但是将内容输入我们系统的整个过程却大不相同。有时当你渲染一个页面或当你看到一个页面被渲染时,你会看到这个,它使用非常旧的 JavaScript 文件,因为我们已经能够缓存它们一段时间,这在浏览器上可能不会发生,但本质上是不同的。”
缓存控制标头
23:59 “ Google 是否会接受带有“Cache-Control: no-cache”、“Cache-Control: max-age=[time]”或“Expires: [date]”标头的 301 重定向,以便我们获得两全其美?”
约翰说:“是的,那很好。如果是 301 重定向,我们将其视为 301 重定向。在此之上添加什么样的缓存标头并不重要。所以从这个角度来看,如果这是一个对你的开发团队和你自己都有效的解决方案,为什么不呢。[…] 另一件事是 302 重定向也可能是一种选择,如果这对您的开发团队更有效。302 重定向在 SEO 中名声不佳,我认为这是不正确的,因为它们的工作方式与普通重定向相同。并不是说他们不通过任何类似的 PageRank,如果从长远来看,您有 302 重定向,我们无论如何都将它们视为 301 重定向。因此,如果您无法弄清楚 301 重定向是如何工作的,也许 302 重定向也是一种选择。”
识别质量改进
31:25 “如果通过页面体验更新提高页面质量对谷歌很重要,为什么谷歌需要这么长时间才能认识到这些改进?如果 SEO 不得不牺牲几个月来失去搜索位置和流量,那么他们致力于做出真正的改变以改善 Web 体验似乎是违反直觉的。”
根据约翰的说法,“[…] 如果您在网站上进行更大的更改,那么有时您确实会看到波动,但我们不会说这些波动之所以存在,是因为您改进了网站。只是当您对网站进行真正的重大更改时,我们必须重新理解网站。但从我的角度来看,您可以在整个网站上进行的许多重组取决于您的设置方式 […] – 您可以以一种在搜索和这样就不会导致您的整个网站消失。”
Noindex 页面与网站可抓取性
32:48 “由于质量原因,多个页面未编入索引是否会影响整个网站的可抓取性?”
约翰:“不。如果您选择不索引页面,这不会影响我们抓取您网站其余部分的方式。当然,这里的一个例外是我们在 noindex 中看到我们必须首先抓取该页面。因此,如果您正在创建某些内容,假设有数百万个页面,其中 90% 是无索引的,而您有一百个可索引的页面。我们必须抓取整个网站才能发现那 100 个页面,很明显,我们会因抓取数百万个页面而陷入困境。但是,如果您的可索引页面与不可索引页面的比例正常,[…] ‒ 我认为这不会在可抓取性方面造成任何问题。这不是 […] 谷歌所说的质量原因,哦不,索引页很糟糕。这纯粹是一个技术问题。如果我们必须抓取一百万个 URL,我们必须抓取一百万个 URL 才能看到那里有什么。这不是我们可以说的,好吧,我们将只抓取 50 000 个,因为有一些没有索引的页面。本质上,这只是一个数字问题。”
302 重定向
34:22 “我们听说临时 (302) 重定向不会传递链接权益。我们的理解准确吗?更一般地说,我们听说使用 302 会导致严重的 SEO 问题,这让我们怀疑是否应该不惜一切代价避免这些问题,或者是否应该在特定情况下使用它们。”
约翰说:“答案显然是否定的。302 重定向不会对 SEO 产生负面影响。我认为当您进行 302 重定向时失去 PageRank 的整个感觉是错误的。它不时出现。我认为出现这种情况的主要原因是 302 重定向根据定义是不同的。[…] 使用 301 重定向,您正在更改地址,并且您希望 Google 系统选择目标页面。使用 302 重定向,您是说,这是暂时的其他地方,但您希望 Google 系统保留原始 URL。因此,如果您纯粹是在跟踪单个 URL 的排名,那么当然,301 将导致目标页面被索引,而排名和 302 重定向将保留原始页面索引和排名。但不会丢失 PageRank 或分配到那里的任何信号。[…] 有时 302 重定向是正确的做法——有时 301 重定向是正确的做法。如果我们在更长的时间内发现 302 重定向,并且我们认为这可能不是临时移动,那么我们也会将它们视为 301 重定向。但是,使用 301 重定向与 302 重定向相比,没有任何隐藏的 SEO 好处。它们只是不同的东西。”
向用户显示较少的内容
46:54 “[有] 我和一位客户有一个问题。[…] 被 robots.txt 屏蔽的许多 URL 也有一个设置在 noindex 上的 HTTP 标头。所以我设置打开robots.txt 以便可以对URL 取消索引。但是客户端担心服务器不会先于所有请求而失败。所以我说,好吧,如果你把用户代理看作一个机器人,你可以只给出一个空白的 HTML 正文或者另一个页面。如果 HTTP 标头设置为 noindex,是否有因为伪装而受到惩罚的风险?”
约翰回答说:“不,我认为这没有任何问题。尤其是,如果您向搜索引擎展示的次数少于向用户展示的次数,那么隐身问题就不是问题。对我们来说更麻烦的伪装部分是,如果您向我们展示了一个非常大且有趣的页面,而当用户到达那里时,他们会看到一些非常微小或略有不同的东西。但是,如果您向我们展示的基本上是一个空白页面,并说,哦,这里没有任何内容不应将该页面编入索引,而我们将其从索引中删除,那么我们不在乎用户是否看到其他内容。所以从我们的角度来看,我们想要避免的是我们向用户承诺他们找不到的东西。因此,如果我们从索引中删除一个页面,我们就不能推荐该页面,因为我们不再拥有它。[…] 如果我们向人们推荐一个页面以进行特定查询,而他们去那里却找不到该内容,那么他们会感到沮丧,他们认为我们做得不好,这就是我们的隐藏问题所在来自。但少展示一点也无妨。”