小心陷阱!数据分析的7大误区,你有踩雷吗?

文 | 商业智能BI相关文章 阅读次数:744 次浏览
2022-08-21 13:02:46

数据是客观的,但解读数据的人是主观的。如果对数据产生误解,导致分析结果和事实不符,则可能造成决策失误。

所以今天,大师兄就来给大家介绍几个在数据分析过程常见的误区,帮助大家更好地规避它们!

01意识误区

1、数据分析很高大上

许多人在提到数据分析时,就觉得那只是少数掌握高级的分析方法或是分析技能的人的事情。

其实不然,真理至简。在分析方法上,我们常说的四象限分析、SPAN图、SWOT分析,都是经过验证的数据分析过程常见的简单有效的分析模型,我们根据不同情况用这些模型,就是站在“前人的肩膀”上做分析。在分析工具上,做数据分析也并不要求大家都掌握 Python、精通算法,只要有合适的分析方法,找到关键性的指标,我们每个人都能用FineBI、Excel这样的简易工具完成分析。

2、 需要大数据才能支撑分析

日常我们听到数据分析,往往都和大数据这个词挂钩,但实际上两者并无任何依赖关系,更多是在炒作大数据这个概念。

分析需要的是特定数据,而不是更多的数据。大数据在很多情况下,其实是无法人力剔除脏数据的情况下的方案,通过放大数据量,减少这些内容的影响。但是如果我们的样本,已经可以反映全量数据,那就已经直接进行分析,并且有价值的数据分析得到的结论也具有足够的可信度。

3、与实际业务脱钩

分析是无止境的,因为有着无穷无尽的变量,但是我们做分析是带有明确目的性的,不要为了分析而分析。解决这个误区最管用的办法,首先要找到最核心的指标(北极星指标),比如我们当前核心目标是app促活;再明确我们能做的事情,比如分析发现给的红包力度越大,用户越频繁使用,留存率越好,但这明显不是可行方案。那我们最终的结论很可能是长期通过运营内容,周期性通过红包促活,这样才能保证合理的获客成本,实现良性的循环。

4、过分依赖数据

过分依赖数据:一方面,会让我们自己做很多没有价值的数据分析;另一方面,也会限制产品经理本身应有的灵感和创意。

数据分析是达到目标的一个科学手段,但不是唯一的手段,而且过分依赖数据也会变得不科学。当数据缺失或是问题简单时,数据分析并不是必要的步骤,也就成了没有价值的数据分析。假如你去造一个汽车,分析以往马车的情况意义不大,甚至限制了对汽车舒适度和速度的想象。

03数据分析过程常见的数据逻辑误区

1、辛普森悖论

先通过一个案例了解一下什么是辛普森悖论:

数据分析过程常见的,有价值的数据分析,数据逻辑

这个表格中,不管是商学院,还是法学院,男生的录取比例都比女生高很多,但是总体来看,女生录取率却是男生的两倍。这种在分组比较中都占优势的一方,在总评中有时反而是失势的一方的情况,就是辛普森悖论。再举一个例子,A 应用的用户每日平均访问时长提升了,因此我们得到了结论,用户的粘性提升了,大家做的真棒!

数据分析过程常见的,有价值的数据分析,数据逻辑

但这是真的吗,如果此时我们把用户根据类型拆分来看,可能会得到如下的结论。

数据分析过程常见的,有价值的数据分析,数据逻辑

这能反映什么呢?核心用户和非核心用户的日均访问时长都没有变化,似乎与之前的结论相悖。此时我们就可以进一步分析,去查看核心和非核心用户的占比情况。我们可以看到核心用户占比提升了,哦,原来是核心用户占比高,所以整体来看,拉高了日均访问时长,此时又忍不住想夸一句大家做得真棒!

数据分析过程常见的,有价值的数据分析,数据逻辑

但这难道就是真的吗,我们需要再看一下各类用户的具体数量。此时我们才得到了真正的结论,原来是非核心用户减少了,有大批用户的流失,才让我们的指标看上去显得变好了。

数据分析过程常见的,有价值的数据分析,数据逻辑

在这个问题中,我们就不只是看最终日均访问时长结果,更应该加上用户数这个观测指标,或是通过合理的规划,将用户数的作用体现在最终指标里。回避辛普森悖论的方法是:斟酌个别分组的权重,以一定的系数去消除以分组资料基数差异所造成的影响;了解该情境是否存在其他潜在要因而综合考虑。

2、因果陷阱

在介绍因果陷阱之前,先给大家举日常生活中经常会看到的观点:

打篮球能让人长高

喝咖啡可以长寿

不吃早饭容易变胖

会撒娇的女人更好命

然而事实真的是这样嘛?下面我们来分别给出这几个常见观点隐藏的因果陷阱:

数据分析过程常见的,有价值的数据分析,数据逻辑

3、幸存者偏差

在讲述幸存者偏差的之前,先给大家举几个例子:

淘宝上卖极限运动设备的商家,尤其卖降落伞、滑翔伞的卖家好评都是满的,从来没有差评。(出事故的人:“我倒是想有差评的机会”)

别人家的孩子都比你强。(日常接触会放大瑕疵,偶尔接触会放大优点)

读书无用论、成功学。(天时地利人和缺一不可,哪怕只从自己身上看,态度勤奋可以争取,挫折都可以模仿,但头脑远见几乎不能复制。)

幸存者偏差出现的原因是数据逻辑和统计上的错误,本质是统计时忽略了样本的随机性和全面性,用局部样本代替了总体随机样本,从而对总体的描述出现偏差。

当然幸存者偏差还很大程度上反映了人性的弱点,人性总是会让我们忽略或筛选信息,最终导致幸存者偏差。要避免幸存者偏差有一下几个方法:

关注沉默的数据,当我们已经习惯了在热搜上看到年入百万、豪车豪宅,拼多多的崛起让「沉默证据」发力:原来下沉市场才是更为广阔的人群。

学习数学统计知识,避免公式错误。就像讲述辛普森悖论里的案例,表面欣欣向荣,其实暗藏了用户流失的风险。

提升认知水平和数据逻辑思维能力,发生幸存者偏差很大程度是因为认知不够宽广,只知道表面信息,没抓住关键信息,最后导致判断失误。

很显然在目前的信息时代,借助类似于FineBI的这些工具,可以让企业加速融入企业数据分析的趋势。备受市场认可的软件其实有很多,选择时必须要结合实际的情况。一般的情况下,都建议选择市面上较主流的产品,比较容易达到好的效果,目前企业数据分析BI软件市场占有率前列的,就是帆软BI软件——FineBI。

数据分析过程常见的,有价值的数据分析,数据逻辑

报表产品更多介绍: www.finereport.com

相关内容

立即体验 立即体验

返回顶部