价格分布-所有数据

TG Data Set: A collection for training AI models.
Post Reply
rakibhasanbd4723
Posts: 558
Joined: Sun Dec 22, 2024 5:09 am

价格分布-所有数据

Post by rakibhasanbd4723 »

限制
赞助内容产品的变化——该研究根 新西兰电报筛选 据一篇赞助文章的成本确定了定价基准。由于一些出版物只向营销人员提供长期承诺,其中可能包括其他好处(横幅、电子邮件、社交推广等),因此一些出版物的单位定价可能会被夸大。因此,回归模型可能不是所有情况下都准确的价格预测器。

社交账户数据——并非所有在线出版物都有 Facebook、Twitter 和 Pinterest 账户。在这些情况下,数字零用于量化关注者。此外,对于在同一网络上拥有多个账户的出版物,该研究测量了关注者最多的账户。

Alexa 排名不准确– Alexa 公开承认,根据其数据做出判断存在局限性。流量相对较低的网站可能无法被 Alexa 准确衡量。

分析
下图旨在展示我们进行赞助内容定价研究时所采用的确切方法。其目的是让读者对我们的定价模型有信心,让他们能够放心地采用这些公式。

当所有价格都绘制成图表时,价格范围的两端都会出现膨胀。为了协调密集区域,该研究分别分解了博客和出版物的定价数据和回归模型。


博客定价分析

下图代表了研究中所有 474 个博客的价格分布。


定价-分销-博客.jpg
由于“更多”区域中记录的价格范围很广且频率较低,我们决定将这些数据点标记为异常值。通过从分析中去除异常值(约占样本的 3.8%),方差减少了 87%,从而建立了更准确的预测模型。研究中列出了去除异常值之前和之后博客数据样本的所有描述性统计数据。

对于剩下的 456 个案例,针对所有预测变量进行价格多变量回归测试,然后删除不显著的变量,以制定博客的定价回归模型,如下所示。
Post Reply