为什么我们认为相关性分析不利于排名因素研究

Share ideas, strategies, and trends in the crypto database.
Post Reply
sharminsumu
Posts: 64
Joined: Sat Dec 21, 2024 5:26 am

为什么我们认为相关性分析不利于排名因素研究

Post by sharminsumu »

如果算法的质量大幅下降,这个特性就很重要。质量下降得越厉害,这一特性就越重要。
如果算法的质量保持不变,那么该特征就不那么重要。
对所有特征重复该过程。这会导致对最重要的定位因素的评估。

我们有意放弃了使用相关性分析的常见做法,并且收到了许多类似的评论:“相关性并不意味着因果关系”,“那些看起来不像排名因素,而更像是相关性”。因此,我们认为这一点值得单独用一段来阐述。

首先,我们想再次强调,用于研究的初始数据收集是高度可变的值的集合。回想一下,我们检查的 SERP 不只一个,而是 600,000 个。每个 SERP 都以其自己的平均特征值为特征,而在相关性分析过程中,这种唯一性被完全忽略。然而,我们认为每个 SERP 都应该被单独对待并尊重其原创性。

只有在检查两个变量之间的关系时,相关性分析才能给出韩国电子邮件清单可靠的结果(例如,反向链接的数量对 SERP 位置的影响)。 “这个特定因素会影响排名吗?”:这个问题可以准确回答,因为涉及唯一有影响的变量。但我们能够单独研究每个因素吗?可能不行,因为有很多因素会影响 URL 在 SERP 中的排名。

相关性分析的另一个质量标准是所收到的相关率的多样性。例如,如果相关率的范围是(-1、0.3 和 0.8),我们可以合理地说有一个参数比其他参数更重要。比率或模量的绝对值越接近 1,相关性越强。如果比率模量低于 0.3,则可以忽略这种相关性:两个变量之间的依赖性太弱,无法得出可靠的结论。对于我们分析的所有因素,相关率均低于0.3;所以我们放弃了这种方法。

拒绝这种分析方法的另一个原因是相关值对像差和噪声的敏感性很高,而不同关键词的数据表明,这样的情况有很多。如果将数据添加到集合中,相关率就会立即发生变化。因此,在存在多个变量的情况下,该指标是不可行的,甚至可能导致错误的推论。让我们补充一点,很难相信存在一个或两个相关率如此接近 1 的因素——如果这是真的,那么任何人都可以轻松破解谷歌的算法,而我们都会处于第一的位置!
Post Reply