1. 假设
假设是关于总体的论述,然后利用数据来考察该论述的合理性。
2. 假设检验
假设检验: 以样本信息和概率论为基础,确定假设是否是一个合理论述的过程。
3. 假设检验五步法
第一步:提出零假设和备择假设
第二步:选择显著性水平
第三步:确定检验统计量
第四步:建立决策规则
第五步:选取样本并作出结论(拒绝 或不拒绝 ,接受 )
3.1 第一步:提出零假设 () 和备择假设 ()
零假设: 以检验数值证据为目的而提出的有关于总体参数值的陈述。
备择假设: 如果样本数据提供了零假设为伪的充分证据时所接受的论述。
注意:
- 不拒绝零假设并不说明 为真,这仅仅意味着我们没有否定 而已。
- 零假设将永远包含等号,等号永远不会出现在备择假设中。
3.2 第二步:选择显著性水平
显著性水平
显著性水平: 零假设为真时拒绝零假设的概率。
希腊字母 用来表示显著性水平,有时也称风险水平。用风险水平可能更合适一些,因为它反映的是当零假设为真时你拒绝零假设所冒的风险。
第I类错误、第II类错误
第I类错误: 当零假设 为真时,拒绝零假设的概率
第II类错误: 当零假设 为假时,接受零假设的概率
举个例子: 对供应商提供的一批元件进行质量检测,次品率低于6%时判定质量不合格。那么零假设是次品率小于或等于6%,备择假设是次品率高于6%。
第I类错误 现在从4000件货品中抽取50件组成一个样本,其中4件(8%)是次品。由于次品率低于6%,所以判定这批货质量不合格。如果这批货确实低于标准规格,那么质量不合格的判定是正确的。然而,假设在50件样本中这4件次品是4000件货物中仅有的4件次品,那么次品率只有0.1%,低于6%,因此判定这批货不合格是错误的。
就假设检验来说,当我们应该接受零假设的时候,却拒绝了零假设,意味着我们犯了第I类错误,犯第一类错误的概率为 。
第II类错误 如果到货有15%是次品,但买家不知道,接收了该批货物,则犯了第II类错误。
比如,假设抽取的50件样品中有2件是次品,其他48件都是合格的,按理说,由于样本的次品率不足6%,所以质量合格。但是也有这样的偶然性,样本中48件合格品是这4000件中仅有的合格品。
3.3 第三步:选择检验统计量
有许多检验统计量,比如z, t, F和
3.4 第四步:建立决策规则
决策规则是零假设被拒绝或者不被拒绝的具体条件。
临界值:零假设被拒绝的区域和不被拒绝的区域的分界点。
3.5 第五步:选取样本并作出结论
假设检验的第五步是最后一步,需要计算检验统计量的值并将其与临界值比较,最后做出是否拒绝零假设的结论。
4. 总体均值的检验:已知总体标准差
检验统计量:
其中, 是样本均值, 是总体均值, 是总体标准差,是样本容量。
假设检验与置信区间
联系
一般来说,如果置信区间不包含假设的总体参数值,则拒绝 ;如果置信区间包含了假设的总体参数值,则 不被拒绝。所以,对于假设检验,“不拒绝的区域”等同于假设的总体参数值落入置信区间内。
区别
对于一个假设检验而言,置信区间和“不拒绝的区域”之间的主要区别在于,置信区间是以检验统计量,如 为中心,而“不拒绝的区域”是以0为中心。
5. 假设检验中的p-值
p-值:零假设为真时,正在观测的样本值至少和已观测到的样本值一样极端的概率。
在假设检验中,我们将检验统计量与临界值进行比较,从而做出拒绝零假设或不拒绝零假设的结论。因此,如果临界值为1.96,计算出的检验统计量为2.19,则拒绝零假设。
然而,我们还想得到关于拒绝或接受零假设程度的额外信息,即我们有多大把握拒绝零假设。
这种方法给出一个概率,这个概率在零假设为真时,正在得到的检验统计量的值至少和实际上已得到的检验统计量的值同样极端的可能性。这一过程是将p-值与显著性水平进行比较。如果p-值小于显著性水平,则拒绝 ;如果p-值大于显著性水平,则不拒绝 。
确定p-值不仅可以得到有关 的结论,还可以进一步告诉我们结论的可靠性。非常小的p-值,比如0.0001,意味着 为真的可能性很小。
6. 总体均值的检验:总体标准差 未知
检验统计量:
自由度为n-1,其中, 是样本均值, 是总体均值, 是样本标准差,是样本容量。
7. 第II类错误
第II类错误的概率计算公式为:
第I类错误 与第II类错误 此消彼长。