原文来源:SparkToro
作者:Vlado Pavlik
2022.7-8月,SparkToro(通过Twitter、email newsletter、LinkedIn、Facebook和Instagram等多个平台)招募志愿者分享其网站的Google Analytics 数据。超过1,000名参与者与我们分享了他们网站的流量数据。接着我们收集了四家第三方网站流量估计工具(即SEMRush、Datos、SimilarWeb和Ahrefs*)提供的数据,并将其与Google Analytics 报告的数据进行比较。此外,我们还收集了Moz域名权重数据和Google Trends 的品牌搜索量数据。所有这些数据都基于同一时间范围:2020年6月至2021年6月,为期一年。
(*在收集指标并发布这篇文章后,有人指出,Ahrefs的流量估算未包含所有流量来源,而仅包含自然搜索访问数据,我们在最初撰写时并未说明或进一步确认。抱歉!)
我们有两个目标:
1️⃣ 找到一个可靠的第三方平台,其估计的流量数据与 GA 数据相关性高且误差较小。这样我们就能(希望如此)将这些数据应用到 SparkToro后续的的受众调研产品中。
2️⃣ 与营销从业者们分享我们的研究成果,以便其他营销人员和分析师能在接下来的工作中更好地利用这些信息和工具。
先说结论,坏消息是:我们认为目前这些第三方网站估计都不够准确,无法应用在SparkToro的后续项目中。我们希望未来这个情况能有所改善,也希望这篇博客可以推动平台们进步。
但也有一个好消息。经过广泛的数据收集、数据整理、MySQL和Excel分析,我们有很多有趣的数据可以与大家分享。接下来就让我们一起来看看吧。
PART 01
哪家第三方网站估计工具与GA的数据误差小于30%?
如果只用单一方式来呈现数据,结果可能会太片面。因此,在这篇文章中,我们将网站规模划分成了六个梯队来进行多维度的对比。其中,如果我得选择一个最喜欢的,且未来几年我将经常提及的(直到有人进行更全面的研究),那就是下面这张分析图表:
为了得到第三方工具最佳运行状态下的结果,我们完成了以下四个操作:
在上面的图表中,每个第三方数据平台也呈现了其每月流量数据与GA提供的数据误差在30%以内的次数百分比。重要的是,我们还根据网站的流量高低对其进行了细分,最终呈现为如下六个梯队:
我们相信这些结果是真实且有用的。我们调研的网站规模已经足够大,即使我们将样本量增加10倍甚至100倍(比如收集10W+网站的GA数据),最终结果可能也差不多。
值得注意的是,尽管SimilarWeb是明显的赢家,但还是有一个例外:它在小型网站(根据GA的定义,小型网站指的是每月访问者少于5,000人的网站)的流量估计中表现最差。如果它在这方面能有所改进,它将在其他分析中也能占据明显优势。但,但当我们采用其他指标来评判时,情况发生了很大的变化。
PART 02
第三方工具与GA用户之间的相关性
我们介绍的第二个指标是大多数估计人员都很熟悉的一个指标:相关系数。如果你很早之前就已经关注了我的博客,你可能记得我曾经介绍过谷歌排名和Moz指标之间的相关性。
这个分析有些不同。
为什么呢?因为所有的第三方平台和GA(我们正在与之比较)都试图测量同样的东西:网络流量。机器学习指标与有数百或数千输入的算法是不冲突的。下面的图表简单地展示了SEMRush、Datos、SimilarWeb和Ahrefs的流量指标与Google Analytics在相同时间框架内对相同网站收集的流量指标的对比。
上图显示了各个平台与Google Analytics每个月报告的用户指标之间的原始相关性。范围从0(无相关性)到1.0(完美相关性),在641个网站共7692项每月数据中,SEMRush表现最好,为0.790,紧随其后的是Datos的0.720,然后是SimilarWeb的0.659,以及Ahrefs的0.504(注意,Ahrefs只测量有机搜索流量;当他们与Google Search Console的指标进行相关性分析时,结果是~0.75)。
如果你想了解的话,我们还选择了包括Moz的域名权重(Domain Authority)和Google Trends的"平均兴趣时间"(Average Interest Over Time)指标。这两个指标都不是用来衡量搜索流量的,但两者仍然具有相关性,而且我们知道营销人员有时会使用它们作为相对流量水平的参考指标。这份报告有助于澄清它们是否有助于衡量搜索流量。
但是,关联性只是衡量这些指标性能的一种方式。为了继续挖掘这些指标的价值,我们决定研究大家都比较感兴趣的问题:"这些第三方平台的数据到底存在多大的偏差?"
PART 03
第三方指标的流量估算范围
在下面的图表中,你会看到每个数据提供平台的正负值。这些正负值代表了它们与GA数据的偏差,即每个平台高估或低估了网站流量的最大值。由于数据较多,这张图只能看第一梯队(GA估计用户超过25万/月的网站)的数据。
下方的图表比较了所有四个平台在五个流量较低的梯队的表现。
在这些数据中,我们看到了平台之间一些很有意思的差异。其中最突出的几个是:
这些不是平台和GA的数据之间的平均方差;它们显示了最大误差和最小误差。上面的图回答了"所有第三方平台在整个数据集的大方向上有多大偏差?”,而这些图表回答的是"这些数据可能存在多大偏差?"
如你所见,偏差值可能高达+/-100%甚至更多,这意味着第三方平台可能会声称某网站在6月获得了50,000次访问,但它实际上却仅有5,000或高达100,000次访问。事实上,这些工具在小型和中型网站表现出了更高的准确性,但差异也可能很大。
PART 04
第三方工具出现误差的频率如何?
最后一个要回答的问题是——是否不同平台提供的流量数值常常在同一方向上存在偏差?下图比较分析了每个平台在六个梯队的表现来较为全面地回答这个问题。
一些有意思的发现:
这轮分析并没有告诉我们方差值,但好在我们已经在上述分析中涵盖了这一点。
研究思考:
我们进行这次数据分析是为了找到一个(或几个)数据值得信赖的平台,哪怕结果并不完美。在过去的几年里,我们的首选是SimilarWeb,但也非常看重Eli Goodman和Datos的团队,以及Tim Soulo和他在Ahrefs的伙伴们。
但是,至少当涉及到估计一个网站在某个月得到多少流量,或者流量是上升还是下降这个问题上,我与Martin MacDonald的看法是一致的:
对于某些范围的流量,一些平台是相当不错的。但是,目前没有哪个第三方工具的数据是一贯准确的,不足以让大家完全相信它们的数据。相关性并不是很糟糕。误差范围也没有特别大(访问量最大的站点除外)。这些数据并不是来源于猜测,很显然这些平台都拥有可靠数据源和流程的支持。只是数据还没有精准到那个程度。
如何使用这些数据?
对于大型网站,建议使用SimilarWeb的估计数据。在大部份的情况下,相比于其它平台,它提供的数据误差都在30%以内。
对于小型网站,Datos的数据表现是最强的。由于他们是一个刚成立不久平台(<2年),希望在几年后,如果我们重新做这份评估,它可以成为行业领导者。
不得不说,我们对Google Trends品牌搜索兴趣(brand search interest)与流量的相关性如此之差感到震惊。这无疑是本次研究者,最让我们惊讶的一个。对我们来说,接下来需要马上采取的措施是:停止使用Google Trends来预测一个网站有多受欢迎。事实证明,一些热门品牌的网站并没有获得多少流量,而一些品牌搜索兴趣较低的网站却获得了很多流量。
Copyright © 2024 深圳市环创网络技术有限公司版权所有
粤ICP备17073372号