【分析方法系列】之相关分析法

163 阅读3分钟

分析方法系列文章导航:

什么是相关分析法?

相关分析是对两种变量之间的非函数关系的一种存在关系,当我们研究两种以上的数据有什么关系的时候,就要用到相关分析,类似我们探讨身高与体重之间的关系就属于相关关系。

下面举个栗子: 工作压力过大会致人死亡吗?答案是肯定的,有大量的证据表明工作压力会导致早逝,尤其使心脏病猝死的概率陆增。但实际情况是怎样的呢?真的如此吗? 《赤裸裸的统计学》中提到一个案例: 公司高层领导们几乎每天都要做出重要决策,高管们的这些决策关系到公司的前途命运,但他们所承受的风险要远远小于他们的秘书,后者必须兢兢业业地接听电话,完成上级布置的各种任务。 但是怎么可能呢? 其实最危险的一类工作压力是来自对自己的工作任务“缺乏控制力”,曾经来自英国一份报告指出,针对数千名英国公务员调查,那些对自己的工作没有支配能力的雇员,即基本上对干什么、怎么干没有话语权的人,相比起那些拥有更多决策权的雇员来说,前者的死亡率更高。

相关分析法有什么用?

包含以下三点 。

1.在研究两种或者两种以上数据之间有什么关系,或者某个事情受到其他因素影响的问题时,可以使用相关分析;

2.在解决问题的过程中,相关分析可以帮助我们扩大思路,讲视野从一种数据扩大到多种数据;

3.相关分析方法在实际工作中很重要,因为数据分析的结果需要得到他人的理解和认可,所以要方便大家沟通。

如何应用相关分析法解决问题?

使用相关分析来找出哪些因素与分析目标有相关关系,例如,分析目标“为什么销售额下降了”,通过假设校验我们找出了渠道、地区、产品这 3 个可能原因,然后分别计算出渠道、地区、产品和“销售额”的相关系数,通过观察这些相关系数的大小,得知哪些因素对销售额影响最大。

分析方法系列】之假设检验分析法中讲到一个案例:

(1)通过对现有渠道的分析,发现渠道 B 的用户明显下降了; (2)找研发部门了解情况,讲过排查,最后发现产品登录接口近期升级过,导致少数部分用户无法登录; (3)经过调研发现,竞品最近没有搞大的活动,最后结论:没有竞品问题。

因为公司资源有限,一个阶段只能集中解决一个问题,那么优先解决哪个问题呢?这时候就要分析这 3 个因素哪个对日活跃率影响最大。

注意事项:

相关关系往往会和因果关系相互混淆,那么如何判断两种数据之间是相关关系,还是因果关系呢? 通常要用到“单变量控制法”即控制其他因素不变,只改变其中一个因素,然后观察这个因素对实验结果的影响。

备注:以上部分案例来自《数据分析思维:分析方法和业务知识》学习笔记;