数据处理
我本以为我会提取六个月的 Mashable 帖子;直到我开始提取数据并意识到他们每月发布近两千篇帖子。两千篇。天哪,蝙蝠侠。两千篇帖子和一个月对我的分析来说已经足够了。如果有人想做更多,我很想听听六个月的数据。
:Google Docs 的 ImportXML、 Excel 的 SEOTools和 Microsoft Excel。
导入XML
为了收集帖子标题,我使用厄瓜多尔电话号码列表 了 Google Docs 的 ImportXML。链接的指南将比我所能告诉你的更多有关如何使用 ImportXML 从网站抓取内容的信息。对于那些好奇的人,我附上了我在 Mashable 中使用的公式。如果您只是想看看公式的实际作用,这里有一个只读的 文档供您研究。
第一个重要部分是要抓取的页面。您需要转到博客/网站的存档页面。对于 Mashable,您可以通过点击其主页上的“下一步”来访问它们。这将为我们提供要抓取的页面。下面的 A1 是您输入要抓取的页码的地方。这个公式对我来说是单元格 A2——您马上就会知道这一点。
在下面,您可以完成导入。这三个占据了 A3、B3 和 C3。如前所述,一旦我提取了标题,我想我就会继续下去。URL 对于您可以使用 SEOTools 提取的内容很重要,因此请务必添加它。日期和评论数对于深入分析很重要。评论数以及社交指标是您可以从外部提取的唯一真正的“成功”指标。我的意思是,除非 Mashable 愿意与我分享每篇文章的流量数字……不?该死。
附注:亲爱的 Mashable 技术人员,抱歉,我抓取了大量数据,其他人可能也是如此。不过这可能只占您服务器流量的 0.001%。:)
从这里,您只需复制并粘贴到 Excel 表中,然后继续(更改 A1 中的页码),直到获得所需的帖子数量。
SEO工具
这是我最喜欢的新工具,原因有很多,其中最重要的一点是能够在 Excel 中使用正则表达式。你也兴奋吗?好吧,它还可以使用 URL 返回社交指标,返回规范 URL 等等。如果你还没有下载,请下载。并捐赠。这个东西值得。
我使用了三个工具来提取分析所需的数据
-
- Posts: 29
- Joined: Mon Dec 23, 2024 3:43 am