解决域偏移:跨任务条件下的 EEG 身份识别模型优化实践

4 阅读13分钟

一、读到这篇文章的起点

最近在看两个相互关联的方向:一个是脑电信号(EEG)在生物识别中的应用,另一个是身份识别模型在复杂真实场景下的鲁棒性问题。在看这类研究时,一个很自然的问题会冒出来:很多 EEG 身份识别工作都是在单任务、单场景下做的,模型在同一种任务里效果很好,但如果换一个任务状态,身份特征还能不能稳定保留下来?如果这一点做不到,EEG 身份识别离真实应用其实还有距离。

带着这个问题,就读到了这篇论文 “Research on EEG Identity Recognition Based on the Cross-Task Condition”。这篇文章最吸引人的地方在于,它没有只在单一任务内做身份分类,而是明确把问题推进到了**跨任务条件(cross-task condition)**下:训练数据和测试数据来自不同任务状态时,模型还能否识别出同一个人。

二、论文与会议来源

这篇文章收录于 2024 7th Asia Conference on Cognitive Engineering and Intelligent Interaction (CEII 2024) 论文集。论文首页给出了 DOI:10.1109/CEII65291.2024.00011,并显示该文页码为 11–15

从论文页眉可以看出,这是一篇 IEEE 收录的会议论文,研究主题属于脑电信号处理、身份识别与认知交互的交叉方向。就会议定位来看,这篇论文和 CEII 的主题是契合的,因为它既涉及 EEG 信号建模,也涉及智能交互与认知状态下的个体差异分析。

三、这篇文章主要在解决什么问题

这篇文章要解决的核心问题可以概括为:

在不同任务状态之间,是否能够从 EEG 中提取相对稳定的个体身份特征,从而实现跨任务身份识别。

作者在摘要和引言里讲得很清楚:传统生物特征如指纹、人脸、声音虽然应用广泛,但存在容易被复制、被伪造、失去活体性等问题。相比之下,EEG 具有更强的抗伪造性、抗胁迫性和活体检测特征,因此被视为一种很有潜力的新型生物识别方式。

但问题在于,现有大多数 EEG 身份识别研究都要求被试反复执行单一、重复的任务。也就是说,很多模型只是在某种固定采集条件下有效。一旦任务状态发生变化,识别性能就可能下降。因此,这篇文章真正想回答的问题不是“EEG 能不能做身份识别”,而是:

EEG 身份识别能不能跨任务泛化。

四、为什么这个问题难做

读下来会发现,这个问题并不只是“换个训练集和测试集”这么简单,它真正难在三个层面。

1. EEG 的任务相关成分和身份相关成分往往混在一起

EEG 信号本身高度复杂,不同任务会引起明显不同的脑活动模式。比如视觉诱发任务和静息态任务,本来就具有不同的神经机制。因此在跨任务条件下,模型很容易学到的是“任务差异”,而不是“个体差异”。

也就是说,这篇文章面对的关键困难是:

如何从 EEG 中分离出更稳定的、跨任务共享的身份特征。

2. 不同任务的信号结构差异很大

这篇研究同时用了两大类 EEG 数据:

  • c-VEP 数据:基于伪随机编码视觉诱发电位
  • 静息态 EEG 数据:包括睁眼(EO)和闭眼(EC)

这两类任务在刺激方式、脑区响应和信号结构上差异都很明显。尤其 c-VEP 还进一步分成 Top、Bottom、Left、Right 四种任务条件,本质上构成了多个不同的认知状态。因此,跨任务识别不只是轻微分布偏移,而是明显的任务域差异。

3. 不同模型擅长捕捉的特征类型并不一样

作者没有默认某一种模型一定适合跨任务条件,而是比较了多种方法:

  • EEGNet
  • CNN+LSTM
  • AR + MFCC + CNN+LSTM
  • AR + MFCC + SVM

这本身就说明作者意识到:
跨任务识别不只是分类器问题,还涉及特征提取方式是否能抓住任务无关成分

五、作者是怎么拆解这个问题的

我觉得这篇文章最值得学习的一点,是它没有把问题直接写成“做一个跨任务分类器”,而是做了一个比较清楚的拆解。

第一步:先构建跨任务 EEG 数据集

为了研究跨任务身份识别,作者先采集并构建了一个跨任务 EEG 数据集。数据包括两大部分:

  1. c-VEP 数据
    通过固视十字和闪烁的圆/环刺激,诱发编码视觉诱发电位。根据刺激位置不同,划分为:

    • Top
    • Bottom
    • Left
    • Right
  2. 静息态 EEG 数据

    • 睁眼静息态(EO)
    • 闭眼静息态(EC)

作者的思路很清楚:如果想研究跨任务识别,就必须先让数据本身包含多个任务状态。

第二步:把“跨任务识别”具体化为训练集和测试集来自不同任务

论文中对 cross-task condition 的定义非常明确:

  • 若训练集和测试集来自同一种任务数据,就是 same-task
  • 若训练集和测试集来自不同任务数据,就是 cross-task

例如:

  • c-VEP 中用 Top 训练、Bottom 测试
  • 静息态中用 EC 训练、EO 测试

这样一来,问题就被转化成一个很具体的实验设计问题:
不同任务之间训练—测试迁移时,模型性能下降多少,哪种方法更稳。

第三步:再比较“端到端模型”和“显式特征提取 + 分类器”两条路线

作者设计了两类方法做对比:

路线 1:直接端到端识别

  • EEGNet
  • CNN+LSTM

路线 2:先做特征提取,再做分类

  • AR + MFCC + CNN+LSTM
  • AR + MFCC + SVM

这种拆解很有意思,因为它实际上在比较两个问题:

  1. 端到端模型能不能自己学到跨任务身份特征?
  2. 传统信号处理特征(AR、MFCC)能不能显式提取更任务无关的成分?

六、技术路线:这篇文章的方法框架

从方法部分来看,这篇文章的整体技术路线可以理解成四个模块。

1. 数据采集与实验设计

论文共招募了 20 名受试者,排除了视觉或神经系统疾病、头部外伤以及影响神经功能的药物使用情况。实验数据包括 c-VEP 和静息态 EEG。

c-VEP 实验

视觉刺激使用实心圆和圆环,结合上下左右四个位置的刺激方向,构建出轻度认知负荷下的 c-VEP 实验范式。

静息态实验

每轮实验中,受试者先进行 10 秒睁眼静息,随后进行 10 秒闭眼静息

最终,作者将数据组织成:

  • c-VEP:Top / Bottom / Left / Right 四个任务集
  • 静息态:EO / EC 两个任务集

2. 数据预处理

作者对原始 EEG 做了比较完整的预处理,包括:

  • 对 c-VEP 事件标签延迟 0.14 秒
  • 使用 Chebyshev Type I IIR 滤波器做 0.5–86 Hz 带通滤波
  • 使用 ICA 去除伪迹
  • 通道选择与降采样
  • 按任务事件标签切分数据
  • 基线校正与异常值去除

这一部分说明作者比较重视 EEG 信号的标准化处理,因为跨任务实验对数据质量会更敏感。

3. 特征提取方法

(1)AR:提取时域身份特征

作者使用 自回归模型(Autoregressive, AR) 从时域提取个体身份特征。AR 模型本质上是利用信号过去若干时刻的值来预测当前值。论文中 AR 模型阶数设为 P = 12

作者认为,AR 在脑机接口身份识别中已有较多应用,因此适合用于挖掘 EEG 中较稳定的个体时域特征。

(2)MFCC:提取频域与倒谱特征

作者进一步引入 Mel-frequency cepstral coefficients (MFCC)。虽然 MFCC 最常用于语音识别,但文中指出,它在脑机接口身份识别中也显示出比传统频域特征更强的身份表征能力。

具体做法包括:

  • 使用 18 个 Mel 三角带通滤波器
  • 再做对数变换
  • 最后通过离散余弦变换,取前 12 个系数

论文认为,这种方式有助于提取任务无关但个体可区分的特征。

4. 分类模型

(1)CNN+LSTM

作者使用了卷积长短期记忆网络来联合建模 EEG 的空间特征与时间特征。

  • CNN 负责提取局部空间特征
  • LSTM 负责提取时间序列中的连续依赖关系

其中卷积部分使用了一维卷积核,既在时间维度做卷积,也用 (Nc × 1) 的卷积核去计算通道之间的连接关系。
这里 Nc 是通道数,在 c-VEP 数据中为 9,在静息态数据中为 19

(2)SVM

SVM 被用作传统机器学习分类器,用于接收 AR + MFCC 提取后的特征进行身份分类。
作者采用多分类方式训练多个 SVM 模型,并通过最高预测分数来决定身份标签。

(3)EEGNet

EEGNet 是文中表现最好的方法。作者把它描述为一个轻量级、高泛化性的 EEG 深度学习模型,能够同时提取时间域与空间域特征,而且参数较少,适合 EEG 分类任务。

论文中根据采集数据特点,对 EEGNet 参数做了适配,使其用于身份识别任务。

七、实验结果说明了什么

1. 在 c-VEP 跨任务实验中,EEGNet 整体最稳

论文讨论部分指出,在以 Top 任务为训练集的实验中,EEGNet 在同任务和跨任务条件下都取得了最高准确率,并且基本都在 90% 以上

相比之下:

  • CNN+LSTM 在同任务条件下可达到 98.57%
  • 但在跨任务条件下下降明显

例如,当 Top 作为训练集时:

  • 若 Bottom 作为测试集,准确率只下降 1.72%
  • 若 Left / Right 作为测试集,则下降更明显,分别约 13.06%11.12%

这个结果很有意思,因为它说明:

  • CNN+LSTM 在同任务内很强
  • 但 EEGNet 在跨任务条件下更稳定

2. AR + MFCC 有助于提取任务无关成分

论文指出,使用 AR + MFCC 做特征提取后,再接 CNN+LSTM,虽然在同刺激条件下准确率略低于直接使用 CNN+LSTM,但在刺激无关的跨任务实验中准确率反而提升了,尤其在不同轮次实验之间提升最明显。

作者据此认为:

AR 和 MFCC 确实提取到了某些任务无关的潜在神经活动成分。

3. SVM 不适合这个任务

虽然 AR + MFCC 提取的特征本身有帮助,但当这些特征送入 SVM 后,分类准确率明显下降。作者认为,这表明:

  • AR + MFCC 特征是有价值的
  • SVM 的超平面分类方式不如 CNN+LSTM 这类时空特征学习模型适合 EEG 身份识别

4. 在静息态 EO/EC 跨任务实验中,EEGNet 仍然表现最好

在静息态实验里,作者使用:

  • EO 训练,EC 测试
  • EC 训练,EO 测试

讨论部分指出:

  • EC 训练、EO 测试 时,EEGNet 的跨任务准确率达到 99.22%
  • 相比同任务实验只下降了 5.99%

相比之下:

  • CNN+LSTM 的跨任务准确率只有 77.61%
  • 比同任务下降了 20.21%

而加入 AR + MFCC 后,CNN+LSTM 的跨任务准确率又提升到了 85.64%

这个结果进一步支持了前面的判断:

  1. EEGNet 是最稳的
  2. AR + MFCC 对跨任务泛化有帮助
  3. SVM 依然不理想

八、读完之后的几个感受

1. 这篇文章最有价值的地方,不只是做了 EEG 身份识别,而是把问题推进到了“跨任务”层面

很多 EEG 身份识别论文在单任务场景下准确率很高,但那并不代表模型真的学到了“身份”,因为它也可能只是学到了当前任务范式的特征。这篇文章比较好的地方在于,它明确用不同任务来检验模型是否仍然能识别同一个人。

2. EEGNet 的稳定性非常值得注意

从结果看,EEGNet 虽然不一定在所有同任务实验中达到最高峰值,但它在跨任务场景下最稳定。这说明轻量化、结构合理的 EEG 专用网络,在泛化性上可能比更复杂的 CNN+LSTM 更有优势。

3. 传统特征工程并没有过时

AR 和 MFCC 的结果很有启发。它们并没有在所有场景里直接打败深度学习模型,但在跨任务场景下,它们确实帮助提取了一部分任务无关信息。这说明:

在 EEG 这种高噪声、高任务依赖的信号上,显式特征工程仍然有研究价值。

4. 这篇文章更像是一篇“方法探索 + 数据构建”性质的工作

它的贡献不只是比较了几种算法,更重要的是:

  • 构建了一个跨任务 EEG 数据集
  • 明确提出了 EEG 身份识别中的跨任务问题
  • 给出了端到端模型和传统特征方法的对比证据

所以它更像是在为“真正通用的 EEG 身份识别系统”打基础。

九、一个简短总结

如果用一句话概括这篇文章,可以写成:

这篇论文围绕跨任务 EEG 身份识别问题,构建了包含 c-VEP 和静息态 EEG 的跨任务数据集,并比较了 EEGNet、CNN+LSTM、AR+MFCC+CNN+LSTM 和 AR+MFCC+SVM 等方法,结果表明 EEGNet 在各类实验中整体最稳定,而 AR 与 MFCC 有助于提取一定的任务无关身份特征。

它最值得记住的,不只是“EEGNet 准确率高”,而是它回答了一个更重要的问题:

  1. EEG 身份识别能否跨任务泛化;
  2. 哪些方法更适合保留任务无关身份成分;
  3. 为什么跨任务实验比单任务实验更接近真实应用。

十、论文引用信息

Zeng, H., Lin, X., Liao, Z., Huang, Z. (2024). Research on EEG Identity Recognition Based on the Cross-Task Condition. In: 2024 7th Asia Conference on Cognitive Engineering and Intelligent Interaction (CEII). IEEE, pp. 11–15. DOI: 10.1109/CEII65291.2024.00011.

十一、会议网站

CEII 2024 会议页面:https://www.ceii.asia/his2024.html

IEEE 会议论文集页面:https://ieeexplore.ieee.org/xpl/conhome/11037609/proceeding