如何规范审核网站

1) 确保在“Configuration > Spider > Crawl”下启用“Store”和“Crawl”规范

默认情况下启用此选项,因此除非您已调整配置,否则这将已设置。SEO Spider 的“配置”在顶级菜单中可用。

抓取规范

这意味着 rel=”canonical” 中引用的 URL 将被抓取,以及提取和报告。接下来,单击“确定”。

2) 抓取网站

打开 SEO Spider,在“输入蜘蛛网址”框中键入或复制您要抓取的网站,然后点击“开始”。

抓取站点以审核规范

网站和 rel=”canonical” 元素中的任何 URL 都将被抓取。

现在喝杯咖啡,等到进度条达到100%,爬行就完成了。

3) 查看规范选项卡

礼服标签显示的所有URL的抓取发现和它们的相应的rel =”规范”链接在主窗玻璃元件和HTTP礼服在单独的相应列。

规范选项卡有 6 个过滤器,可帮助您了解规范实现并识别常见规范问题。

规范选项卡

‘Occurences’ 列计算为每个 URL 发现的 rel=”canonical” 元素的数量。

右侧概览窗口窗格提供包含在每个选项卡和过滤器中的数据摘要,因此您知道单击何处,而无需检查每个过滤器以查看是否有数据。在下图中,我们可以看到 1 个“规范化”的 URL 和 1 个“非可索引规范化”的 URL。

规范右手概述窗格

您可以通过以下方式进行过滤 –

  • 包含规范– 页面具有规范的 URL 集(通过链接元素、HTTP 标头或两者)。这可以是自引用规范 URL,其中页面 URL 与规范 URL 相同,或者它可以是“规范化”的,其中规范 URL 与页面 URL 不同。
  • 自引用– URL 有一个规范,它与抓取的页面 URL 相同(因此,它是自引用)。理想情况下,只有规范版本的 URL 会在内部链接,并且每个 URL 都有一个自引用规范,以帮助避免可能发生的任何潜在的重复内容问题(即使是在网络上自然发生的,例如跟踪 URL 上的参数,其他网站不正确链接到解析等的 URL)。
  • 规范化– 页面具有与其自身不同的规范 URL。该 URL 被“规范化”到另一个位置。这意味着搜索引擎被指示不要索引页面,并且索引和链接属性应合并到目标规范 URL。应仔细查看这些 URL。在一个完美的世界中,网站不需要规范化任何 URL,因为只有规范版本会链接到,但由于各种无法控制的情况,并且为了防止重复内容,通常需要它们。
  • 缺失– 没有作为链接元素或 HTTP 标头的规范 URL。如果页面未指明规范网址,Google 将确定他们认为最好的版本或网址。这可能导致排名不可预测,因此通常所有 URL 都应指定规范版本。
  • Multiple – 为一个 URL 设置了多个规范(多个链接元素、HTTP 标头或两者的组合)。这可能会导致不可预测性,因为页面的单个实现(链接元素或 HTTP 标头)应该只设置一个规范 URL。
  • 不可索引的规范– 规范的 URL 是不可索引的页面。这将包括被 robots.txt 阻止、无响应、重定向 (3XX)、客户端错误 (4XX)、服务器错误 (5XX) 或“noindex”的规范。URL 的规范版本应该始终是可索引的,“200”响应页面。因此,转到不可索引页面的规范应更正为解析可索引版本。

4) 通过下方窗口窗格的“URL 信息”选项卡查看不可索引的规范 URL“可索引状态”

底部的“URL 信息”选项卡显示了规范不可索引的原因。根据下面的示例,此规范 URL 不可索引,因为它已重定向。

不可索引的规范 URL 信息

规范 URL 是“https://www.thelightingsuperstore.co.uk/clearance-lighting/clearance-stock-light-fittings”,它会重定向。因此,这被视为“不可索引”。

5) 使用“报告 > 规范 > 不可索引规范”导出到批量导出源 URL、不可索引规范 URL 及其状态代码

要批量导出包含不可索引规范的源页面的详细信息、它们各自的可索引性、可索引性状态、状态和状态代码,请单击顶级菜单中的“报告”并选择“规范 > 不可索引规范”。

不可索引的规范

这种导出通常更容易消化和修复,(或发送给开发人员进行修复)。它还包括通过普通 HTML 锚点元素在抓取中“未链接”的任何规范 URL 的详细信息。

6) 单击“报告 > 规范 > 规范链”报告以查看链式规范和循环

与重定向类似,规范也可以链接并具有循环。一个页面 URL 可以规范化为另一个 URL,另一个 URL 规范化为另一个 URL,依此类推。或者,通常是规范和重定向的组合。

规范链报告

导出此报告后,筛选“规范”或“混合”的“链类型”列以查看规范链。在上面的示例中,由于不可索引的规范 URL,我们可以看到存在一个“混合”重定向循环。

下图显示了导出的电子表格,其中显示了两个“重定向”(这实际上意味着“跳跃”,因为它可以包含规范化的 URL)、固定列中的起始“地址”和“最终地址”。最终地址可索引性是“不可索引的”,因为它是“规范化的”。单击图像以展开。

规范链导出

滚动到电子表格的右侧,会显示已发现的每个跃点。我们可以看到地址有一个带有 301 状态代码的规范重定向,它返回到起始 URL(导致循环)。同样,您可以单击图像将其展开。

规范链导出第 2 部分

总结电子表格,规范链导出显示 https://www.thelightingsuperstore.co.uk/clearance-lighting 页面的规范 URL 设置为 https://www.thelightingsuperstore.co.uk/clearance-lighting/清仓库存灯配件。

但是,https://www.thelightingsuperstore.co.uk/clearance-lighting/clearance-stock-light-fittings 规范 URL 实际上 301 重定向回原来的 https://www.thelightingsuperstore.co.uk/clearance-lighting父页面。

虽然这不是一个大问题,但对于搜索引擎来说,这是一个相互矛盾的信号,应该予以纠正。在某些情况下,规范链可能更大、更复杂,此报告将有助于识别和突出错误以及链中的完整路径。

给TA打赏
共{{data.count}}人
人已打赏
网站建设

如何将你的 404 页面重定向到 WordPress 中的主页

2021-6-28 10:46:03

网站建设

如何将任何 WordPress 表单连接到 Google 表格(简单方法)

2021-6-30 23:48:07

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索