置信区间。在 统计学中,置信区间是指一个人口参数落在两个设定值之间的概率。置信区间衡量的是抽样方法的不确定性或确定性程度。一个置信区间可以采取任何数量的概率,最常见的是95%或99%的置信度。
计算置信区间(理论)
假设一个研究小组正在研究高中篮球运动员的身高。研究人员从人群中随机抽取样本,确定平均身高为74英寸。74英寸的平均值是人口平均值的一个点估计。点估计本身的作用有限,因为它没有揭示与估计相关的不确定性;你不能很好地感觉到这个74英寸的样本平均数与人口平均数可能有多大的差距。缺少的是这个单一样本的不确定性程度。
信心区间比点估计提供更多的信息。通过使用样本的平均值和标准差建立一个95%的置信区间,并假设钟形曲线所代表的正态分布,研究人员得出了一个包含95%的真实平均值的上下限。假设这个区间在72英寸和76英寸之间。如果研究人员从整个高中篮球运动员群体中随机抽取100个样本,其中95个样本的平均值应该在72和76英寸之间。
如果研究人员想要更大的信心,他们可以将区间扩大到99%的信心。这样做必然会产生一个更广泛的范围,因为它为更多的样本平均值提供了空间。如果他们将99%的置信区间确定为70英寸和78英寸之间,他们可以预期100个被评估的样本中有99个样本的平均值在这些数字之间。90%的置信度意味着我们期望90%的区间估计值都包含人口参数。同样,99%的置信度意味着95%的区间将包括该参数。
置信区间是基于平均数和标准差的,给出的结果是。
对于n>30
置信区间 = X ± (z * s/√n)
其中z临界值是根据置信区间从z分值表中得出的。
X是样本平均数。
s是样本标准差。
n是样本大小
我们只从z分数表中获得这些数值,但由于置信度在大多数情况下是固定的,如上述数值,所以我们可以使用这个表格。
对于n<30
置信区间 = X ± (t * s/√n)
其中t临界值是根据置信度从t评分表中得出的。
X是样本平均数。
s是样本标准差。
n是样本大小。
我们将在接下来的例子中看到如何创建置信区间。
现在我们已经掌握了假设检验背后的所有理论,让我们看看用于检验的不同类型的检验。我们已经看到了寻找z分数和t分数的例子,我们将看到它们是如何在测试场景中使用的。
大样本的假说检验
经验法则。规模大于30的样本被认为是大样本,根据中心极限定理,我们将假设所有的抽样分布遵循正态分布。
我们对前面所示的假设检验的步骤很熟悉。从上表中,我们也知道何时使用哪种类型的检验。
让我们从几个实际的例子开始,以帮助我们更好地理解。我们将只使用下面的标准化临界值表进行计算。
问)一个打印机墨盒的制造商声称他生产的某种墨盒的平均打印量至少为500页。一个批发商选择了一个100台打印机的样本并进行测试。样品的平均打印能力为490页,标准偏差为30页。
在5%的显著性水平下,采购员应该拒绝制造商的说法吗?
答案:群体平均数=500
样本平均数 = 490
样本标准偏差=30
显著性水平(α)=5%=0.05
样本量=100
H0:平均印刷能力>=500
H1:平均印刷能力<500
我们可以清楚地看到这是一个单尾检验(左尾)。
在这里,样本是大的,有一个未知的群体方差。由于我们不知道数据的正态性,我们将使用Z检验(来自上表)。
我们将使用样本方差来计算临界值。
标准误差(SE)=样本标准差/(样本量)*0.5
= 30 / (100) *0.5 = 3
(Z(测试)=(样本平均数-群体平均数)/(SE
= (490–500)/3 = -3.33
让我们利用上述临界值表找出5%显著性水平下的临界值。
Z(0.05%)= - 1.645(因为它是左尾检验)。
我们可以清楚地看到,Z(测试)< Z(0.05%),这意味着我们的测试值位于拒绝区域。
因此,我们可以在5%的显著性水平上拒绝无效假设,即制造商的主张。
使用p值来检验上述假设。
p值=P[T<=-3.33](我们知道p(-x)=1-p(x),还记得p(x)代表的是
从0到x的累积概率)
让我们用Z表来计算P值。
P值 = 1-0.9996 = 0.0004
这里,p值小于5%的显著性水平。所以,我们拒绝无效假设是正确的**。**
信心区间面试问题最初发表于Nerd For Techon Medium,在那里人们通过强调和回应这个故事继续对话。