在第二版 SEMrush 排名因素研究 2017中,我们添加了 5 个与反向链接相关的因素,并比较了它们对特定 URL 和整个域的影响强度。按照我们的传统,我们将为您提供更深入的方法论见解。
我们使用的方法在 SEO 研究领域是独一无二的:我们用决策树森林的机器学习算法——随机森林来代替相关性分析。由于我们研究的最终目标是帮助 SEO 专家确定任务的优先顺序并更有效地完成工作,因此我们希望揭示我们研究的细节并揭穿一些常见的误解,以便您可以放心地依赖我们的研究结果。
由于这篇文章是为真正的书呆子写的,因此这里有一个简短的词汇表:
决策树——树状结构代表通常应用于分类任务的机器学习算法。它根据最重要的属性将训练数据样本划分为同质组/子集。
监督学习——一种机器学习算法,它训练模型来寻找输入变量(特征,A)和输出变量(目标值,B)之间关系的规律:B = f(A)。目标是在数据样本上训练该模型,以便当呈现样本外数据时,算法可以根据给定的特征集准确预立陶宛电邮清单测目标值。收集学习数据就像老师照顾学习过程一样。当算法达到可接受的性能质量时,学习就被认为是成功的并结束。
特征 (或属性、输入变量) ——用于分析的独立数据条目的特性。对于我们的研究和这篇博文,特征是假定的排名因素。
二元分类——一种属于监督机器学习的分类任务。该任务的目标是预测每个数据条目的目标值(=类别),对于二元分类,这只能是 0 或 1。