主观正确与客观正确

273 阅读9分钟
原文链接: zhuanlan.zhihu.com

许多人不太明白什么是正确,拿捏不准正确的标准,所以会被神棍骗。人的主观标准对于判断来说是极其脆弱的,非常容易受到情绪、心理倾向的欺瞒,学会正确的检验方法对于建立正确的三观来说很重要。

假设你走在街上,有个人跟你说他能猜中你扔的硬币的正反,然后让你试了一次,他果然猜到你手里硬币是正面。你怎么看?他果然有超能力吗?

我们知道硬币只有正反两面,那一个人猜中你一次扔硬币结果的概率有50%。不管看上去有多神奇,这并不是一个很难发生的事情,实际上他平均找两个人就能成功一次,所以这远远不能说明他真的有超能力。对这个问题来说,我们要考虑“某个人有超能力”这件事情的可靠程度,我们首先要构造一个相反的命题:这个人没有超能力。用最平凡的假设,来判断在这个假设条件下,发生眼下的状况的可能性有多大,依据这个可能性来做出判断。

用数学来描述的话,我们要判断的命题是A:这个人有超能力,我们观察到的事件是O:猜中了了一次掷硬币的结果。我们希望知道的是P(A|O),但这个概率不好估计,反过来我们使用P(O|\bar A)来进行判断,这个方法就叫做假设检验:我们假定这件事只是个偶然,看看这个偶然到底偶然到了什么程度呢?

对这个问题来说,很显然P(O|\bar A) = 0.5,这是个非常大的概率,说明这就是个哪都能见到的事情,并没有什么说服力。要增加说服力,我们可以继续实验,要求他再猜几次。那么猜几次我们就可以开始相信他可能的确有超能力呢?统计学上我们一般取5%作为一个标准,如果P(O|\bar A) < 0.05,我们就应该好好考虑一下这件事情有可能是真的。对抛硬币这个问题来说,需要对方连续猜中5次。

那么如果这是个严谨的科学研究呢?

重要的科学研究中的假设检验一般要求5个σ,即使是学生实验之类的比较简单的科学实验,也要求3σ什么意思呢?

3个σ,换算成概率大概是P(O|\bar A) < 0.0013 = 0.13\%,要比我们刚才的5%的标准还要低了不少。5个σ,换算成概率大概是P(O|\bar A)=0.00000029,平均三百万次实验也不会出现一次,这是极小的概率。我们能接触到的所有的物理定律,都经过了这个准确度的实验的检验,考虑到这些实验通常还被不同的人重复了许多次,更是充分说明了理论的可靠性。这就是为什么我们对科学有这么强烈的信心,那些违背科学的理论没有一个能够经得起3个σ的检验,更不要说5σ了。你现在问我“你怎么知道科学就一定是正确的”??5%都突破不了的理论,和三百万分之一概率是实验误差的理论,你相信哪一个?

回到前面的话题,现在这个人答应做实验,但是他连续猜了7次,其中有两次猜错了,他解释说,这是他当时精神不够集中,状态不好,这样终于也猜对了5次,你现在相信他有超能力了吗?有的人会想,失误也是难免的嘛,7次平均猜对3.5次,这都猜对5次了,挺厉害的了啊。

那么实际上呢?

P(O|\bar A) = C_7^2 (0.5)^7 = 0.164 = 16.4\%

16.4%大概是个什么概念呢,一般手机游戏抽卡抽到一般稀有的卡片可能是10%左右,坚持玩偶尔都能成功,不用很努力。或者说,平均尝试6次左右就能成功一次。可以说运气比较好,但是遗憾,离5%还差得远呢。

我们可以看到,“一件事情是真的”和“你以为一件事情是真的”,中间有多么大的差距。一个人如果没有学会判断对错的正确方法论,没有对概率估计的统计学知识,他甚至根本没有资格说他认为什么事情正确,什么事情不正确。

现在这个人不猜硬币,改猜你父母关系是和睦还是不和睦,猜你工作顺利或者不顺利,猜你生病了或者没生病,猜你结婚了或者没结婚,猜明年股市是涨还是跌,10件事猜对了3、4件,你应当怎么判断?参见上文。

=====================================================================

现在又一个人出现了,他不敢当面猜你硬币,但他拿出了一堆证据,证明他以前曾经猜对过几十、几百个人手里的硬币,这些人是如何感叹他的神奇,你怎么看?

我现在扔了100次硬币,猜中了其中50次,我挑选这50次出来宣传,能说明我猜硬币神准吗?如果不知道是一共在多少次中猜中了多少次,你要怎么计算P(O|\bar A)


现在又一个人出现了,他不敢当面猜你硬币,但他拿了一次记录出来,证明他曾经连续猜中5次硬币,虽然他并没有胆量当场复现。你怎么看?

我每天坚持猜5次硬币,猜一年,平均下来我有十天左右都能猜个全对,我精选这十天出来,能说明我猜硬币神准吗?


如果你没法确认样本是不是经过了人为的选择,你是无法从这个结果中得到任何信息的,除非这些样本即使经过人为选择也是不太可能出现的,比如说如果有人能拿出确凿证据证明自己曾经连续100次都猜中了硬币正反面,这个概率就算是猜一辈子也几乎不可能出现,那应该可以说明问题。

遇到这类人,不要废话,少拿过去经历说事,现场实验,5%,这已经是对神棍足够优待的条件了,做不出来,请圆润地滚开,不要再装神弄鬼。也不要说“虽然没算准,但这并不是个骗局”这种屁话。

====================================================================

现在问题又来了,某个人对你说,他朋友的朋友曾经告诉他的朋友,他朋友的朋友亲眼所见,某个人连续猜中了硬币正反面10次。这个人是不是有超能力呢?

10次,P(O|\bar A) < 0.1\%,已经到达了大约3σ的可靠性了。这下总是真的有超能力了吧?

先不论这个记录的可靠程度,我们来考虑这件事,你认识的某个人的朋友的朋友见过的某个人,这个群体大概有多大呢?互联网时代,把根本不熟、只是说过一两次话的也算上,每个人怎么也得有大概100个朋友吧,于是你认识的人的朋友的朋友见过的人大概就是100 * 100 * 100 * 100 = 约1亿。一个亿啊朋友们,还不用四舍五入。

考虑到朋友圈的问题,这当中当然会有大量的重复计算,只留下1/10,大概一千万。

这一千万人当中,突然想起来要抛硬币玩的,或者脑子有病觉得自己有超能力的,觉得自己能掐会算的,觉得自己有神棍潜质的,我们就算一百个里面只有一个,剩下十万。

这十万人里,许多人也许很低调,并不愿意宣传自己的神迹,或者病后来治好了不再觉得自己是超能力者了,算没治好的还有一百分之一,也就是1000人。

这1000人都抛了10次硬币,其中999个只是被嘲笑了一番,并没有成为你认识的人的朋友的朋友见到的那个人,也没有成为他们口中的谈资,而剩下一个刚好碰到了0.1%左右的成功率,你现在还觉得这件事神奇吗?


下次看到某些人讲的故事说托梦啦,神算啦,三岁小孩一语成箴啦,如果不是亲眼所见,每隔一层(经过一次转述,比如别人亲眼所见是一层,别人的朋友亲眼所见是两层,别人朋友的朋友是三层)至少按乘以10修正概率;如果是网上特定话题,比如“你们都有哪些灵异体验?”这种,至少乘以100,这里的人本身就是经过精选的样本,如果还是转述,继续10倍10倍往上乘。如果是来自专门取材这类资料的新闻媒体,也同样至少乘以100,他们接触过的素材本身就是先有神奇之处,即便这样其中100件也未必有一件值得报道。从这样的视角看,其实根本就没有什么特别神奇的事情:500万头奖的中奖概率不到一千万分之一,这比5σ还要低,还不是老有人中——买的人太多了啊。只要样本空间够大,再小概率的事情也是能发生的。这跟科学实验里面,我就现场做一次,一次就做出来5σ的结果,是完全不同的。

题外话:因为“不友善”被知乎封了一个星期。但我仍然要说:

我绝不对骗子友善

我绝不对骗子友善

我绝不对骗子友善

作为一个知识分子,利用无知、传播无知的人,不管有意无意,都是我的阶级敌人,我跟他们只有你死我活,没有友善可言。任何以“我的XX术有100%准确率,你没学过就没有发言权,你也不过是迷信科学,2000年研究这个的人都没你聪明?”开口的人,我骂你们一句傻X,算轻的。