Page 1 of 1

创建或更新与 Googlebot 首次抓取之间

Posted: Thu Feb 20, 2025 4:47 am
by joyuntochandr656
它只与我的服务器负载增加有关,这会让你花费更多钱。所以,这与抓取的数量无关。这关乎抓取的质量。这就是我们需要开始衡量抓取的方式,因为我们需要做的是查看从创建或更新内容到 Googlebot 抓取该内容所花的时间。

的时间差,我称之为抓取效率。因此,衡量抓取效率应该相对简单。您可以进入数据库,导出创建时间或更新时间,然后进入日志文件,获取下一次 Googlebot 抓取,并计算时间差。

但让我们面对现实吧。对于我们很多人来说,访问日志文件和数据库并不是最 土耳其手机号码数据 容易的事情。所以你可以使用代理。你可以从 XML 站点地图中查看你从 SEO 角度关心的 URL 的上次修改日期时间,这些 URL 应该只出现在你的 XML 站点地图中,你也可以从 URL 检查 API 查看上次抓取时间。

我真正喜欢 URL 检查 API 的地方在于,如果您正在主动查询 URL,您还可以在索引状态发生变化时获取该状态。因此,有了这些信息,您实际上也可以开始计算索引效率分数。

因此,看看您重新发布或首次发布后,Google 需要多长时间才能索引该页面?因为,实际上,没有相应索引的抓取并没有多大价值。因此,当我们开始查看并计算实际时间时,您可能会发现从您创建或更新 URL 到 Googlebot 抓取它,可能需要几分钟、几小时、几天或几周的时间。

如果这是一个很长的时间段,我们实际上能做些什么呢?好吧,搜索引擎及其合作伙伴在过去几年中一直在谈论他们如何帮助我们作为 SEO 更有效地抓取网络。毕竟,这符合他们的最佳利益。从搜索引擎的角度来看,当他们更有效地抓取我们时,他们可以更快地获取我们的宝贵内容,并能够将其展示给他们的受众,即搜索者。

他们也可以编一个好故事,因为爬虫会给我们和环境带来很大负担。它会产生大量温室气体。因此,通过提高爬虫效率,他们实际上也在帮助地球。这也是您应该关心这个问题的另一个动机。所以他们在发布 API 方面投入了大量精力。