集合标准差只是两个或多个独立小组的标准差的加权平均值。
在统计学中,它最常出现在双样本t检验中,用来检验两个种群的平均值是否相等。
计算两组的集合标准差的公式如下。
汇总标准差 = √(n1-1)s12 + (n2-1)s22 / (n1+n2-2)
其中。
- **n1,n2。**分别为第一组和第二组的样本量。
- **s1, s2:**分别为第1组和第2组的标准偏差。
下面的例子显示了在R中计算两组之间的集合标准差的两种方法。
方法1:手动计算集合标准差
假设我们有两个样本的以下数据值。
- 样本1:6,6,7,8,8,10,11,13,15,15,16,17,19,19,21
- 样本2:10,11,13,13,15,17,17,19,20,22,24,25,27,29,29
下面的代码显示了如何计算这两个样本之间的集合标准差。
#define two samples
data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21)
data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29)
#find sample standard deviation of each sample
s1 <- sd(data1)
s2 <- sd(data2)
#find sample size of each sample
n1 <- length(data1)
n2 <- length(data2)
#calculate pooled standard deviation
pooled <- sqrt(((n1-1)*s1^2 + (n2-1)*s2^2) / (n1+n1-2))
#view pooled standard deviation
pooled
[1] 5.789564
汇集的标准差结果是5.789564。
方法2:使用软件包计算集合标准差
在R中计算两个样本之间的集合标准差的另一种方法是使用effectsize包中的**sd_pooled()**函数。
下面的代码显示了如何在实践中使用这个函数。
library(effectsize)
#define two samples
data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21)
data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29)
#calculate pooled standard deviation between two samples
sd_pooled(data1, data2)
[1] 5.789564
汇集的标准差结果是5.789564。
请注意,这与我们在前面的例子中手动计算的值相吻合。
其他资源
下面的教程提供了关于计算集合标准差的更多信息。
The postHow to Calculate Pooled Standard Deviation in Rappeared first onStatology.