现在是时候设置尖叫青蛙了。我们在尖叫青蛙中使用“自定义提取”功能(设置→自定义→提取)。这使我们能够从一组页面中捕获特定文本,因此我们继续配置提取参数。
第一个提取器在 XPath 中配置。当您需要捕获同一 URL 处的多个线程标题时,您可以将代码剪切并粘贴到以下提取器中。请务必在最后更新编号规则,以避免一遍又一遍地使用相同的信息。
另请注意,我们在示例中将提取类型设置为“提取文本”,这通 公关总监电子邮件列表 常是获取所需信息的最简单方法。您可能还需要获取 HTML 的不同部分,这需要一些尝试和错误。我们邀请您尝试其他选项并比较结果,但现在让我们继续前进。
要获取我们需要的实际提取代码,在 Chrome 中,我们右键单击链接以获取并选择“检查”或“检查元素”。
确保您在代码视图中看到要突出显示的文本,然后右键单击并选择“XPath”(您可以使用其他选项,但应首先查看 Screaming Frog 文档)。很多时候,当我们尝试获取文本的 XPath 时,实际上必须选择所选文本上方一级的 HTML 元素。