目前遇到的统计学具体应用。其实前面三种应用,都可具象化为统计学的各种分布形态图,围绕各种不同的分布形态图,根据已知条件,求分布图的宽度、点、高度、区间 等信息。分布图很重要。
估计总体参数的准确性和可靠性
估计总体参数这一课题中,主题是“准确性”“可靠性”
什么是总体参数:用来描述一个总体特征的数值,比如,总体均值、总体方差、总体标准差、总体比例。总体的特征被称为“参数”,样本的特征被称为“统计量”。
一些需要提前了解的总结性话语:置信水平主要用于评估总体参数的准确性和可靠性,而样本统计量是直接从样本数据中计算得出的具体数值。由于总体往往很大,不能直接一一从所有数据中得到参数,所以要依靠样本统计量来估计总体参数。而置信水平,是评估样本统计量作为总体参数估计的可靠性提供的重要信息。由于置信区间的公式是 置信区间=样本均值±(临界值 * 标准差),也就是说求置信区间要先获取样本均值、样本标准差、临界值。临界值用于计算置信区间的宽度。基于想要的不同置信水平就有不同的临界值;不同的分布型态,相同的置信水平有不同的临界值。
首先理解置信区间。
置信区间是统计学中用于估计总体参数的一种方法。它提供了一个范围,表示在一定的置信水平下,参数的真实值可能落在这个范围内。具体来说,置信区间的构建通常基于样本数据,通过以下几个要素来确定:
样本均值
样本标准差
置信水平:通常选择95%或99%,表示对区间包含真实参数的信心程度。(这个置信水平的选择值怎么来的,有时间可研究,实际职场应用中用不上)
临界值:根据正态分布或t分布确定的值,用于计算置信区间的宽度。在统计分析中,置信水平通常与临界值相关联,临界值可以通过标准正态分布表或t分布表来查找。例如,对于95%的置信水平,正态分布的临界值大约为1.96,而对于99%的置信水平,临界值大约为2.576。
置信区间计算公式:置信区间=样本均值±(临界值 * 标准差)
例如,如果我们对某个总体均值进行估计,算出置信区间为(10,20),就意味着有95%的信心认为总体均值落在10到20之间。
关于临界值,为什么很多情况下根据正态分布而不是其他分布查找临界值?
这取决于几个因素:
中心极限定理:中心极限定理表明,当样本量足够大时,样本均值的分布趋近于正态分布,无论原始数据的分布如何。这意味着对于大样本(通常n>30),我们可以使用正态分布来估计样本均值的分布。
大样本:当样本大小较大时(如n > 30),使用正态分布是合适的,因为样本均值的分布接近正态。
小样本:对于小样本(如n ≤ 30),如果原始数据的分布已知且接近正态分布,可以使用正态分布;如果不确定,通常使用t分布。
在统计学中,有多种概率分布,每种分布都有其特定的性质和应用场景。
用一个例子把以上知识串联起来:
例子:测量某种药物的效果
背景:
假设我们想要研究一种新药对降低血压的效果。我们从100名患者中随机抽取了样本,并测量了他们在服用药物后的血压下降值(单位:毫米汞柱)。
做假设检验
做假设检验过程中的主题是:错误率
第一类错误:指原假设正确(true),但是我们假设检验的结论却显示原假设错误。(本来是真,判断为假,弃真a)。第一类错误在实际操作中表现为:实验结论显示我的新策略有用,但实际上我的新策略没用。
第二类错误:原假设错误(false),但是我们假设检验的结论却显示“原假设正确(true)、备择假设错误”,这一过程中我们接受了错误的原假设,这种错误叫“取伪”。第二类错误在实际操作中表现为:我的新策略其实有效但实验没检测出来。
统计功效:统计功效=1-第二类错误的概率,统计功效在现实中表现为:我的新策略是有效的,我有多大概率在实验中检测出来。题外话:如何计算第二类错误的概率?这个是可以计算的,但是实际工作中暂时用不上,先不纠结了。
显著性水平(a):指的是研究者愿意接受的第一类错误的概率,一般会取0.05、0.01。它决定了拒绝原假设所需的证据强度,比如:如果显著性水平为0.05,意味着在原假设为真的情况下有5%的概率会错误的决绝原假设。
在进行假设检验时,研究者通过比较P值与显著性水平来判断是否拒绝原假设。实际使用中,P值比a值小,即为实验结果有效(可拒绝原假设)
做假设检验的步骤:
① 提出原假设和备择假设
② 算统计量(X的平方,t等)
③ 选检验方法:T检验、Z检验、秩和……
④ 判断实验结果:P值计算:根据选择的检验方法,套他们的公式,查表得P值,若P>a,结论为:按a所取水平不显著,不拒绝原假设,在统计上不成立;若P<=a,结论为:按a所取水平显著,拒绝原假设,接受备择假设,在统计上成立。
计算样本量
应用场景:在AB测试中计算最小样本量
step 1:明确目标
比如:希望A组转化率显著高于B组
step 2:设定原假设&备择假设
step 3:设定显著性水平和统计功效
step 4:估计效应大小
是你期望检测到的最小差异,比如:你预计A组的转化率为10%,B组转化率为12%,那么效应大小是2%
step 5:使用样本量计算公式