我们实际上可以很容易地通过图表来证明这一点

TG Data Set: A collection for training AI models.
Post Reply
rakibhasan
Posts: 203
Joined: Tue Dec 24, 2024 4:57 am

我们实际上可以很容易地通过图表来证明这一点

Post by rakibhasan »

让我举个例子来说明为什么这很重要。直观地讲,你会想象范围会随着范围变大而以类似的对数方式增加。例如,你可能认为大多数关键字的波动率为 10%,因此如果某个关键字每月被搜索 100 次,你可能会预计某些月份的波动率为 90 次,而其他月份的波动率为 110 次。同样,你也会预计每月被搜索 1,000 次的关键字也会上下波动 10%。因此,你可以创建 0-10、100-200、1,000-2,000 等范围。事实上,这似乎正是 Google 所做的。它简单而优雅。但它正确吗?

不。事实证明,关键字数据并不一致 就业数据库 它通常遵循这些模式,但并非总是如此。例如,在我们的分析中,我们发现,虽然 101-200 之后的音量范围是 201-500(广度增加了 3 倍),但下一个最佳范围实际上是 501-850,广度仅增加了 1/6。

这可能是由于与某些关键词相关的非随机人类搜索模式造成的。有些关键词人们可能每天、每周、每月、每季度等搜索一次。想象一下“本月第一个星期一是哪天”和“本月最后一个星期二是哪天”这样的关键词。所有这些关键词都会被类似的人群以类似的次数每月搜索,从而产生非随机的一致性。这些模式会导致术语波动的变化,这些变化与数据真正随机时预期的自然对数尺度不一致。我们的机器学习量范围可以高效、有效地捕获这种非随机的人类行为。

关键字规划器范围对数的上升趋势线图。Google 的范围大小几乎是完全线性的,这意味着它们根本没有针对搜索量波动和季节性的非线性、非随机性质进行优化。
请注意,在此图中,Google 关键字规划师量范围的对数几乎是线性的,除了尾端。这表明 Google 几乎没有尝试解决使数据非随机的搜索行为模式。相反,他们对其量桶应用了一条简单的对数曲线,然后就此打住。R 2值显示了这种关系有多接近 1(完美线性)。

Moz 范围对数的上升趋势线图。Moz 的关键字资源管理器量范围远不那么线性,因为它们经过训练以最大化特异性和覆盖率,利用人类搜索模式中的非随机变化。
Post Reply