相关性并不意味着因果关系。5个现实世界的例子

1,138 阅读3分钟

相关性并不意味着因果关系"这句话在统计学中经常被用来指出,两个变量之间的相关性并不一定意味着一个变量导致另一个变量的发生。

为了更好地理解这句话,请考虑以下现实世界的例子。

例子1:冰激凌销售和鲨鱼袭击

如果我们每年收集美国各地每月的冰淇淋销售和每月的鲨鱼袭击的数据,我们会发现这两个变量是高度相关的。

这是否意味着食用冰淇淋会导致鲨鱼袭击?

不尽然。更有可能的解释是,当外面比较暖和的时候,更多的人消费冰淇淋并进入海洋,这解释了为什么这两个变量如此高度相关。

虽然冰淇淋的销售和鲨鱼袭击高度相关,但一个并不导致另一个。

例2:硕士学位与票房收入的关系

如果我们收集大学每年颁发的硕士学位总数和每年的总票房收入的数据,我们会发现这两个变量是高度相关的。

这是否意味着颁发更多的硕士学位会导致每年的票房收入增加?

不尽然。更有可能的解释是,全球人口每年都在增加,这意味着每年颁发更多的硕士学位,以及每年看电影的人数都在大体上等量地增加。

虽然这两个变量是相关的,但其中一个并不导致另一个。

例三:泳池溺水事件与核能生产

如果我们收集每年游泳池溺水事件的总数和核电站每年生产的能源总量的数据,我们会发现这两个变量是高度相关的。

这是否意味着泳池溺水事件的增加在某种程度上导致了更多核能的生产?

并非如此。更有可能的解释是,全球人口一直在增加,这意味着更多的人在游泳池中溺水,而核能生产每年都变得更加可行,这解释了为什么核能生产会增加。

虽然这两个变量是高度相关的,但一个并不导致另一个。

例四:麻疹病例与结婚率的关系

如果我们收集美国每年的麻疹病例总数和每年的结婚率的数据,我们会发现这两个变量是高度相关的。

这是否意味着麻疹病例的减少会导致结婚率的降低?

并非如此。相反,这两个变量是独立的--现代医学导致麻疹病例减少,每年由于各种原因结婚的人也减少。

虽然这两个变量是高度相关的,但其中一个并没有导致另一个。

例5:高中毕业生与比萨饼消费

如果我们收集美国每年的高中毕业生总数和披萨消费总量的数据,我们会发现这两个变量是高度相关的。

这是否意味着高中毕业生人数的增加会导致美国的比萨饼消费增加?

不尽然。更有可能的解释是,美国人口随着时间的推移一直在增加,这意味着随着人口的增加,获得高中学位的人数和被消费的比萨饼总量都在增加。

尽管这两个变量是相关的,但其中一个并不导致另一个。

其他资源

下面的教程提供了关于相关性的额外信息。

皮尔逊相关系数的介绍
相关与关联。
什么被认为是 "强 "相关?
你什么时候应该使用相关?

The postCorrelation Does not imply Causation:5个现实世界的例子出现在Statology上。