如何在R中计算集合标准差

191 阅读2分钟

集合标准差只是两个或多个独立小组的标准差的加权平均值。

在统计学中,它最常出现在双样本t检验中,用来检验两个种群的平均值是否相等。

计算两组的集合标准差的公式如下。

汇总标准差 = √(n1-1)s12 + (n2-1)s22 / (n1+n2-2)

其中。

  • **n1,n2。**分别为第一组和第二组的样本量。
  • **s1, s2:**分别为第1组和第2组的标准偏差。

下面的例子显示了在R中计算两组之间的集合标准差的两种方法。

方法1:手动计算集合标准差

假设我们有两个样本的以下数据值。

  • 样本1:6,6,7,8,8,10,11,13,15,15,16,17,19,19,21
  • 样本2:10,11,13,13,15,17,17,19,20,22,24,25,27,29,29

下面的代码显示了如何计算这两个样本之间的集合标准差。

#define two samples
data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21)
data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29)

#find sample standard deviation of each sample
s1 <- sd(data1)
s2 <- sd(data2)

#find sample size of each sample
n1 <- length(data1)
n2 <- length(data2)

#calculate pooled standard deviation
pooled <- sqrt(((n1-1)*s1^2 + (n2-1)*s2^2) / (n1+n1-2))

#view pooled standard deviation
pooled

[1] 5.789564

汇集的标准差结果是5.789564

方法2:使用软件包计算集合标准差

在R中计算两个样本之间的集合标准差的另一种方法是使用effectsize包中的**sd_pooled()**函数。

下面的代码显示了如何在实践中使用这个函数。

library(effectsize)

#define two samples
data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21)
data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29)

#calculate pooled standard deviation between two samples
sd_pooled(data1, data2)

[1] 5.789564

汇集的标准差结果是5.789564

请注意,这与我们在前面的例子中手动计算的值相吻合。

其他资源

下面的教程提供了关于计算集合标准差的更多信息。

汇总标准差简介
汇总标准差计算器

The postHow to Calculate Pooled Standard Deviation in Rappeared first onStatology.