基于无线 EEG 的大学生多级焦虑筛查机器学习方法

6 阅读11分钟

一、读到这篇文章的起点

最近在看两个相互关联的方向:一个是脑电(EEG)在心理健康筛查中的应用,另一个是机器学习能不能把传统问卷筛查进一步变成更客观的生理信号辅助评估工具。在这个过程中,一个很自然的问题会冒出来:像焦虑这样的心理状态,通常依赖问卷和访谈来评估,但如果能把 EEG 这种非侵入、实时的脑信号引入进来,是否可以帮助做更细粒度、更客观的焦虑分级筛查。

带着这个问题,就读到了这篇论文 “A Machine Learning Approach for Multi-Level Anxiety Screening among University-going Students using Wireless EEG Signals”。这篇文章比较吸引人的地方在于,它不只是做“有焦虑 / 无焦虑”的二分类,而是试图进一步完成多级焦虑分类,也就是把焦虑程度分成更细的层次来识别。

二、论文与会议来源

这篇文章收录于 2024 7th Asia Conference on Cognitive Engineering and Intelligent Interaction (CEII 2024) 论文集。论文首页给出了 DOI:10.1109/CEII65291.2024.00013,并显示该文页码为 21–25

从论文定位来看,这项工作处在EEG 信号处理、心理健康筛查、机器学习分类的交叉位置。它和 CEII 这类会议的主题是契合的,因为它既涉及脑信号分析,也涉及智能识别与认知健康评估。

三、这篇文章主要在解决什么问题

这篇文章要解决的核心问题可以概括为:

能否利用无线 EEG 信号和机器学习方法,对大学生人群进行多级焦虑筛查。

作者在摘要和引言里讲得很清楚:焦虑是一种全球广泛存在的心理健康问题,会带来情绪和身体层面的多种症状,严重时甚至可能发展为更严重的心理危机。因此,及早、准确地识别焦虑水平很重要。

论文特别指出,目前很多 EEG 焦虑研究仍然集中在二分类任务,主要区分“焦虑”和“正常”两类;而对多级焦虑分类的研究还比较少。也就是说,这篇文章真正想推进的问题不是“EEG 能不能检测焦虑”,而是:

EEG 能不能进一步区分不同焦虑程度。

四、为什么这个问题难做

读下来会发现,这个问题的难点并不只是“信号分类”,而是至少有三个层面。

1. 焦虑本身是连续变化的状态,不是简单的有无之分

如果只做二分类,很多细微差别会被忽略掉;但如果要进一步区分 minimal、mild、moderate、severe 四种焦虑水平,模型就必须学到更加细致的脑活动差异。

2. EEG 信号噪声较多,而且不同脑区信息贡献不一定相同

EEG 天生容易受噪声、个体差异和设备条件影响。尤其在这篇论文里,作者使用的是 EMOTIV EPOC+ 无线 EEG 头戴设备,虽然便携、适合实际应用,但信号质量控制和通道选择就显得更关键。

3. 多级分类通常比二分类更容易受样本量限制

这篇研究最终用于焦虑分类的数据来自 20 名大学生,每个焦虑等级各 5 人。虽然每个人有 5 分钟 EEG,可通过分段得到更多样本,但从被试数量本身来看,仍然属于相对小规模数据。对于四分类问题来说,这会增加泛化难度。

五、作者是怎么拆解这个问题的

我觉得这篇文章比较值得学习的一点,是它没有直接把问题写成“训练一个分类器”,而是先把整个流程拆成了几个清楚的步骤。

第一步:先用标准量表给焦虑程度打标签

作者先做了一个大规模初筛:Independent University, Bangladesh 超过 500 名学生参与初始筛查,使用的是 GAD-7(Generalized Anxiety Disorder-7) 问卷。

之后,从中筛选出同意参加 EEG 采集、并符合研究条件的学生。最终用于本文焦虑研究的数据有 20 名受试者,按照 GAD-7 分成四组:

  • 0–4 分:Minimal / Anxiety Control
  • 5–9 分:Mild Anxiety
  • 10–14 分:Moderate Anxiety
  • 15 分及以上:Severe Anxiety

这一步很关键,因为作者先把“焦虑程度”这个标签体系定义清楚了,后面的 EEG 分类才有明确目标。

第二步:再采集 EEG,并比较不同通道组合

作者用 EMOTIV EPOC+ 采集 EEG,设备共有 14 个通道

  • AF3, AF4
  • F3, F4
  • F7, F8
  • FC3, FC4
  • T7, T8
  • P7, P8
  • O1, O2

采样率为 128 Hz,每位受试者记录 5 分钟 EEG

为了研究不同脑区信息的作用,作者没有只用全通道,而是设计了四种通道组合:

  • 全部 14 通道
  • 8 个额叶通道
  • 7 个左半球通道
  • 7 个右半球通道

也就是说,作者不仅想知道“能不能分出来”,还想知道:

哪些通道组合更适合焦虑分级。

第三步:再比较不同分段长度

作者进一步把每位受试者的 5 分钟 EEG 切分成三种不同长度的非重叠片段:

  • 1 秒
  • 3 秒
  • 5 秒

这样一来,问题又进一步被具体化成:

不同 epoch 长度会不会影响焦虑分类效果。

第四步:最后在特征层和分类器层完成建模

论文提取了 11 个特征,包含时间域和频域两部分:

时间域特征

  • Skewness
  • Kurtosis
  • Variance
  • Arithmetic Mean
  • Shannon Entropy

频域特征

  • Gamma Band Power
  • Beta Band Power
  • Alpha Band Power
  • Theta Band Power
  • Delta Band Power
  • Alpha / Beta Band Power Ratio

在分类阶段,作者采用的是 Ensemble Bagged Trees,并通过 5-fold cross-validation + 100 次迭代 来评估模型稳定性,同时采用 70:30 的训练 / 测试比例。

所以整篇文章的逻辑链条非常清楚:

GAD-7 分级 → EEG 采集 → 通道组合比较 → 分段长度比较 → 特征提取 → Bagged Trees 分类。

六、技术路线:这篇文章的方法框架

从方法部分来看,这篇文章的技术路线可以理解成六个模块。

1. 受试者招募与标签建立

  • 初筛样本:500+ 名学生
  • EEG 采集对象:60 名学生
  • 本研究焦虑分类最终使用:20 名学生
  • 四类标签依据:GAD-7 分数划分

这一步保证了后续 EEG 数据有明确的焦虑等级标签。

2. EEG 采集模块

EEG 使用 EMOTIV EPOC+ 无线设备采集,共 14 通道,采样率 128 Hz,每位受试者采集 5 分钟

这也体现了文章的应用导向:作者使用的是便携无线 EEG,而不是复杂实验室级高密度系统。

3. 预处理模块

作者对原始 EEG 做了基础滤波处理:

  • 50 Hz notch filter
  • 0.5 Hz high-pass filter
  • 使用 3 阶 IIR Butterworth filter

论文还明确写到:没有使用数据增强

4. 分段模块

每段 5 分钟 EEG 被分成:

  • 1 秒片段
  • 3 秒片段
  • 5 秒片段

形成三套不同的数据集,用于比较分段长度对分类性能的影响。

5. 特征提取模块

总共提取 11 个特征,包括:

时间域

  • Skewness
  • Kurtosis
  • Variance
  • Arithmetic Mean
  • Shannon Entropy

频域

  • Band Power Gamma
  • Band Power Beta
  • Band Power Alpha
  • Band Power Theta
  • Band Power Delta
  • Ratio of Band Power Alpha to Beta

作者的思路比较传统,但也很清楚:先用这些可解释特征去测试多级焦虑分类能做到什么程度。

6. 分类与评估模块

作者采用 Ensemble Bagged Trees 分类器,并使用以下指标评价效果:

  • Accuracy
  • Sensitivity
  • Specificity
  • Precision
  • Negative Predictive Value (NPV)
  • F1 Score

同时采用:

  • 5-fold cross-validation
  • 100 次迭代
  • 70:30 训练 / 测试划分

七、实验结果说明了什么

1. 所有通道组合中,“全部通道”始终表现最好

论文对 1 秒、3 秒、5 秒三种分段长度分别给出了结果。总体来看,在所有分段长度下,使用全部 14 个通道的效果最好

对应的平均准确率分别是:

  • 1 秒分段:92.93%
  • 3 秒分段:95.80%
  • 5 秒分段:95.85%

这说明,从整体性能看,更多通道确实有利于提升焦虑分类准确率。

2. 左半球通道表现 consistently 优于额叶和右半球通道

文章还有一个很有意思的发现:在除全通道之外的三种组合里,左半球通道一直优于额叶通道和右半球通道。

左半球通道的平均准确率分别是:

  • 1 秒分段:90.70%
  • 3 秒分段:94.36%
  • 5 秒分段:94.56%

而且它与全通道的差距并不大:

  • 1 秒时差距:2.23%
  • 3 秒时差距:1.44%
  • 5 秒时差距:1.29%

这个结果很值得记,因为它意味着:

如果考虑计算复杂度与便携性,左半球通道可能是一个很有性价比的选择。

3. 5 秒分段准确率最高,但 3 秒分段更平衡

论文指出,从平均准确率来看:

  • 5 秒分段:95.85%
  • 3 秒分段:95.80%
  • 1 秒分段:92.93%

也就是说,5 秒分段的准确率最高,但只比 3 秒高了 0.05%

同时,作者还指出:

  • 3 秒分段的标准差比 5 秒分段低 0.09%
  • 3 秒分段会产生更多样本数量

所以作者认为,这两者之间存在一个很实际的权衡:

  • 5 秒:准确率略高
  • 3 秒:样本更多,稳定性略好

这个结论我觉得特别有参考价值,因为很多论文只会强调“最高准确率”,但这篇文章至少把样本数量与结果稳定性也一起纳入考虑了。

4. 整体上,EEG 的确有希望支持多级焦虑筛查

从结果来看,这篇文章最重要的结论是:

基于 EEG 和机器学习,四级焦虑分类是可以做到较高准确率的。

尤其是使用:

  • 全部通道
  • 3 秒或 5 秒分段
  • Bagged Trees

时,分类准确率接近 96%,说明这种方法至少在当前数据集上是有效的。

八、读完之后的几个感受

1. 这篇文章最有价值的地方,是把焦虑检测从二分类推进到了多级分类

很多 EEG 心理健康研究只停留在“有无焦虑”的粗分类上,但实际筛查更需要知道焦虑程度。本文尝试把焦虑分成四级来识别,这一点很有现实意义。

2. 它特别强调“无线 EEG”的可用性,这一点很重要

作者使用的是 EMOTIV EPOC+ 无线设备,而不是实验室高密度 EEG。这意味着它的研究目标并不只是理论验证,也在探索更接近真实应用场景的方案。

3. 这篇文章的方法并不复杂,但实验设计比较完整

它没有使用很复杂的深度学习模型,而是采用:

  • 传统统计特征
  • Bagged Trees 分类器
  • 多通道组合比较
  • 多分段长度比较

所以它更像一篇系统性实验比较论文。它的价值不一定在“模型多先进”,而在于:

把多级焦虑筛查这个问题比较完整地拆开做了一遍。

4. 这篇文章也有比较明显的边界

从阅读角度看,这篇工作也有几个比较明显的限制:

  • 受试者数量较少(最终仅 20 人)
  • 来自单一高校样本
  • 焦虑标签依赖 GAD-7 问卷,而不是临床诊断
  • 目前只比较了一种分类器主线,没有和更多深度学习模型系统对比

所以更准确地说,这篇文章提供的是一个很有前景的初步验证,而不是一个已经完全成熟的焦虑筛查系统。

九、一个简短总结

如果用一句话概括这篇文章,可以写成:

这篇论文基于无线 EEG 信号和 GAD-7 标签,构建了一个面向大学生的四级焦虑筛查机器学习框架,通过比较不同通道组合和不同分段长度,发现 Bagged Trees 在全通道和 3–5 秒分段条件下表现最好,准确率接近 96%,显示出 EEG 作为非侵入式多级焦虑筛查工具的潜力。

它最值得记住的,不只是“准确率高”,而是它回答了几个更基础也更重要的问题:

  1. EEG 能不能做多级焦虑分类;
  2. 不同通道组合中哪些更有效;
  3. 不同分段长度下性能和稳定性如何权衡。

十、论文引用信息

Sakib, N., Islam, M. K., Faruk, T. (2024). A Machine Learning Approach for Multi-Level Anxiety Screening among University-going Students using Wireless EEG Signals. In: 2024 7th Asia Conference on Cognitive Engineering and Intelligent Interaction (CEII). IEEE, pp. 21–25. DOI: 10.1109/CEII65291.2024.00013.

十一、会议网站

CEII 2024 会议页面:https://www.ceii.asia/his2024.html

IEEE 会议论文集页面:https://ieeexplore.ieee.org/xpl/conhome/11037609/proceeding