在论文中的,涉及到的 不同实验条件下的差异显著对比,然而,样本并不是总是服从正态分布,所以就需要到此类方法。在这一章中,根据自己的学习经验总结一下此方法,希望对我的论文有用。我一般写得特别废话,因为心理活动很是很丰富,丰富到自己都烦,看到此文繁琐请谅解,或者直接边缘化我吧hh。
概念解释
Wilcoxon Signed-Rank Test(威尔科克森符号秩检验)是一种非参数统计检验方法,主要用于比较两组配对样本的差异,尤其是在数据不符合正态分布的情况下。它是配对样本t检验(paired t-test)的非参数替代方法。
看到这个概念,我首先会想要了解到几个让我这个小白不懂地点:
1-什么叫做非参数;
2-什么叫做秩?
3-什么叫做两组配对样本的差异?三组 四组可以不?
4-感觉要举个例子来让我整体明白一下。
什么叫做非参数?
不依赖于数据的特定分布形式进行假设检验。
比如说,在一堆人中,总会有一个卧龙凤雏(离群值)存在。
再比如说,额 ,贫富差距(左边穷人 右边富人 金钱对比)越来越大。
- 不要求正态分布:与t检验不同,Wilcoxon符号秩检验不要求数据符合正态分布,这使得它在处理小样本或非正态数据时更加适用。
什么叫做秩?
有一个数据集: 5,3,8,5
数据集 排序后:3,5,5,8
数据集 对应的秩(数据项的序号或位置):(注意了)
一般来讲是 1,2,3,4
但是 5=5 ,数据值一样,所以需要共享相同的秩(称为 “平级”) 所以,(2+3)/2=2.5
最终的结果是: 1,2.5,2.5,4
学习到这里,也就是说,非参数检验并不依赖于原始数据,而是依赖于秩次。这也就是解释了原始数据如此之离谱也能用此非参数检验方法来进行显著数据分析。
什么叫做两组配对样本的差异?三组 四组可以不?
不适用哈,Wilcoxon有符号秩检验是针对两组相关样本的检验。
这就引出我另外一个问题:什么叫做相关样本 什么又叫做独立样本呢?
相关样本:在我理解中,就是同一个人把实验条件(2种)都做了。
独立样本:就是 这里有2个人,他做第一个实验条件 ,另外一个做第二个实验条件即可。
- 配对样本:用于比较两组来自相同个体的样本(如前后测试结果、处理前后的测量值等)。
举个例子(来自ChatGPT)
假如你是一名教育研究人员。
研究目的:研究某种语言教学法是否对3岁孩子的词汇量产生影响。
样本总数:10个
对比:未使用该语言教学法 vs 使用该语言教学法
收集数据 计算差值(去除0) 差值绝对值排名 赋予符号
假设10个孩子的教学法前后单词数数据如下:
| 孩子编号 | 教学法前单词数 | 教学法后单词数 | 差值 (后 - 前) |
|---|---|---|---|
| 1 | 10 | 15 | 5 |
| 2 | 12 | 13 | 1 |
| 3 | 8 | 12 | 4 |
| 4 | 15 | 18 | 3 |
| 5 | 11 | 14 | 3 |
| 6 | 7 | 9 | 2 |
| 7 | 14 | 16 | 2 |
| 8 | 9 | 10 | 1 |
| 9 | 13 | 17 | 4 |
| 10 | 10 | 13 | 3 |
对差值的绝对值进行排序,得到每个差值的秩(排名)。
| 孩子编号 | 差值 (后 - 前) | 绝对值 | 排名 |
|---|---|---|---|
| 2 | 1 | 1 | 1 |
| 8 | 1 | 1 | 1 |
| 6 | 2 | 2 | 2 |
| 7 | 2 | 2 | 2 |
| 10 | 3 | 3 | 3 |
| 4 | 3 | 3 | 3 |
| 5 | 3 | 3 | 3 |
| 9 | 4 | 4 | 4 |
| 3 | 4 | 4 | 4 |
| 1 | 5 | 5 | 5 |
计算秩和(排名x符号)
将每个差值的秩与其符号相乘,然后求和。由于所有符号都是正号,最终的秩和就是秩的总和。
| 孩子编号 | 差值 (后 - 前) | 排名 | 符号 | 排名 × 符号 |
|---|---|---|---|---|
| 2 | 1 | 1 | + | 1 |
| 8 | 1 | 1 | + | 1 |
| 6 | 2 | 2 | + | 2 |
| 7 | 2 | 2 | + | 2 |
| 10 | 3 | 3 | + | 3 |
| 4 | 3 | 3 | + | 3 |
| 5 | 3 | 3 | + | 3 |
| 9 | 4 | 4 | + | 4 |
| 3 | 4 | 4 | + | 4 |
| 1 | 5 | 5 | + | 5 |
秩和 = 1 + 1 + 2 + 2 + 3 + 3 + 3 + 4 + 4 + 5 = 32
进行假设检验
零假设:没有显著的差异(差值的中位数为0)
可以使用统计软件(spss,R,python等)来计算p值 (通过查表或使用软件)
如果计算出来的p值小于设定的显著性水平(如0.05),则可以拒绝零假设,认为该语言教学法有显著效果。
以下是总结:
原理
- 计算差异:对于每一对配对数据,计算它们的差异(通常是后测值减去前测值)。
- 绝对值排序:计算每对差异的绝对值,并按照大小进行排序。
- 符号赋值:根据差异的正负符号,对每个排序后的绝对值赋予符号(正号或负号)。
- 秩和计算:对带符号的秩进行求和,分别计算正秩和负秩的和。
- 统计量:计算符号秩和的最小值(即正秩和与负秩和中较小的那个值),并根据样本大小查找对应的临界值,进行显著性检验。
步骤
- 计算每一对数据的差异,并记录差异的符号(正或负)。
- 对差异的绝对值进行排序,并为它们分配秩次。
- 计算正负符号秩次的和。
- 根据样本大小和符号秩和的结果,使用表格或统计软件来确定是否拒绝零假设(即两组之间没有显著差异)。
零假设与备择假设
- 零假设(H0) :两组数据的中位数没有显著差异。
- 备择假设(H1) :两组数据的中位数有显著差异。
使用场景示例
- 比较治疗前后的血压变化。
- 比较学习前后学生的成绩变化。
- 比较不同时间点测量的数据(例如,病人的症状变化)。
优点
- 非参数方法:不依赖数据的分布形式,适用于偏态或非正态分布的数据。
- 简单易用:计算过程相对简单,适合小样本数据。
- 对离群点不敏感:由于使用秩次代替原始数据,极端值对结果的影响较小。
限制
- 只适用于配对样本:只能用于成对的数据,无法处理独立样本。
- 需要配对数据:如果数据中有缺失值或者某些配对无法形成,检验可能会失效。
参考博主链接: