上传列表
当您处于列表模式(模式 > 列表)时,只需单击“上传”按钮并选择从文件上传、进入对话框、粘贴 URL 列表或下载 XML 站点地图。
就这么简单。但是,在上传 URL 时,您应该在列表模式下注意一些初始事项。
需要协议
如果您不包含 HTTP 或 HTTPS(例如,仅包含 www.screamingfrog.co.uk/),则不会读取和上传 URL。
您会看到一条非常悲伤的消息,上面写着“找到 0 个 URL”。所以总是包含带有协议的 URL,例如 –
https://www.screamingfrog.co.uk/
标准化和重复数据删除
SEO Spider 在上传时规范化 URL,并在抓取过程中删除重复数据。假设您有以下 4 个要上传的 URL,例如 –
https://www.screamingfrog.co.uk/
https://www.screamingfrog.co.uk/#fragment-this-wont-be-crawled
https://www.screamingfrog.co.uk/seo-spider/
https://www.screamingfrog.co.uk/seo-spider/
SEO Spider 将自动确定要抓取的唯一 URL 数量。
对于一个小列表,很容易看出(对于大多数 SEO)这 4 个 URL 实际上只有 2 个唯一的 URL,但是对于更大的列表,它可能不那么明显。
SEO Spider 页面是重复的,而片段 URL(带有“#”)不被视为单独的唯一 URL,因此在上传时对其进行了规范化。
如果这些 URL 被上传到 SEO Spider,它会报告它找到了 4 个 URL——并在窗口对话框中将它们标准化——
但是,在抓取时,它只会抓取唯一的 URL(在本例中为 2)。
虽然它只从上传的 4 个 URL 中抓取了 2 个唯一的 URL,但您仍然可以以相同的顺序导出原始上传的列表。
出口
您可以像往常一样使用任何选项卡上的“导出按钮”从列表模式导出数据。
但是,如果您希望以列表模式导出数据以与上传的相同顺序与其他数据匹配,则使用位于顶部“上传”和“开始”按钮旁边的“导出”按钮。用户界面。
导出中的数据将采用相同的顺序,并包括原始上传中的所有确切 URL,包括重复项或执行的任何修复。
“原始 URL”是上传的 URL,而“地址”是 SEO Spider 抓取的 URL。
列表模式下的高级爬网
列表模式非常强大,设置正确。您应该了解一些很酷的高级用途,以帮助您聚焦分析并节省时间和精力。
抓取 URL 列表和另一个元素
列表模式可以非常灵活,允许您抓取上传的 URL 列表和其他元素。
例如,如果您想抓取 URL 列表及其图像。或者,您需要审核 URL 列表及其新实施的规范、AMP 或 hreflang,而不是整个网站。或者您想从 URL 列表中收集所有外部链接,以建立断开的链接。您可以在列表模式下执行所有这些操作,并且过程几乎相同。
进入列表模式后,删除自动设置为“0”的爬网深度限制。转到“配置 > 蜘蛛 > 限制”并取消勾选配置。
这意味着 SEO Spider 现在将抓取您的 URL 列表 – 以及它们链接到的同一子域上的所有 URL。
因此,您需要通过精细的配置选项来控制具体抓取的内容。导航到“配置 > 蜘蛛 > 爬网”。在“抓取”的配置菜单中禁用所有“资源链接”和“页面链接”。
然后选择您希望在 URL 列表旁边“抓取”的元素。例如,如果您想抓取 URL 列表及其图像,则设置将是。
如果您上传单个 URL,例如SEO Spider页面,您可以看到该页面及其图像都被抓取。
这种先进的可配置性允许对您需要的链接元素进行激光聚焦审核。
审核重定向
如果您正在审核站点迁移中的重定向,那么抓取其目标 URL 和遇到的任何重定向链可能特别有用。这样就不必每次都上传多个目标 URL 列表才能完成。
在这种情况下,我们建议使用“配置 > 蜘蛛 > 高级”下的“始终遵循重定向”配置。启用此配置意味着“爬网深度限制”将被忽略,并且重定向将被跟踪,直到它们达到非 3XX 响应(或者直到您在“配置 > 蜘蛛 > 限制”下达到“最大重定向到关注”限制)。
如果您随后使用“所有重定向”报告,它将在单个报告中绘制完整的重定向链。
请阅读我们关于如何审核站点迁移中的重定向的指南,以了解有关此过程的更多详细信息。
连接到 API
在列表模式下,您可以连接到GA、GSC、PSI和反向链接分析工具 API 以提取数据。例如,您可以连接到Ahrefs API,并提取引用域、关键字、流量和值等数据,然后这些数据会显示在“链接指标”选项卡中。
例如,这在为竞争分析收集数据时非常有用。