携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第1天,点击查看活动详情
p 值用于零假设检验,用以量化数据(证据)的统计显著性概念。 零假设检验是一种适用于统计学的归谬法论证(反证法)。从本质上讲,如果一个主张的反主张不可能成立,那么这个主张就是成立的。
因此,需要在检验中被指定并且体现反主张的唯一假设被称为零假设(即要被取消的假设)。如果一个结果允许我们拒绝零假设,那么这个结果在统计学上是显著的。也就是说,根据归谬法推理,如果0假设为真,那么统计上显著的结果(结果是显著的)应该是极不可能的。拒绝零假设意味着正确的假设是零假设的逻辑补充。然而,除非零假设有一个单一的替代品,拒绝零假设并不能告诉我们哪个替代品可能是正确的。
例如,如果一个零假设是假定遵循标准的正态分布N(0,1),然后拒绝零假设可能的意思是(I)均值不为零,或(II)方差不为一,或(III)分布是非正态的,这取决于所进行的检验类型。然而,假设我们设法拒绝零均值假设,即使我们知道分布是正态的并且方差是为一,零假设检验也不告诉我们应该采用哪个非零值作为新均值。
如果X是一个代表观测数据的随机变量,而H0是考虑中的统计假设,那么统计显著性的概念可以通过条件概率Pr(X|H0)量化,这就给出了如果假设是正确的观察的可能性(根据条件概率定义,可理解成假设H0为真,观测到数据或者说随机变量X取得实现值或者说随机变量X实现值出现的概率)。然而,如果X是一个连续的随机变量,观察到一个特定实现值(也称实例)x的概率为0,即Pr(X=x|H0)=0(因为连续随机变量的概率都是在一段区间上定义的). 因此,这个幼稚的定义是不够的,需要改变,以适应连续的随机变量。
尽管如此,它还是有助于澄清p值不应该与假设的概率混淆,例如Pr(H0|X),X的实现值x被观测到的情况下,H0是真的概率,或Pr(H0),假设正确的概率。或Pr(X),观察到给定数据的概率。
p 值陈诉了基于采集的数据而计算的检验统计量的值有多极端。 它对应于,在有效零假设的情况下,得到检验统计量的计算值或极值(观测值 t )的概率。或者更为形象地说: p 值就是在 0 假设为真的情况下一个观测值或更多极端值出现的的概率。