神经活动基础模型架构修正

4 阅读2分钟

作者修正:神经活动基础模型预测新刺激类型的响应

修正自: Nature doi.org/10.1038/s41… 在线发表于2025年4月9日

为确保实现模型的准确记录,以下对方法部分中描述Conv-LSTM和CvT-LSTM架构的若干细节进行澄清。这些澄清仅限于方法描述,不影响结果或结论。

视角模块: 方法部分指出瞳孔位置多层感知机(MLP)使用8维隐藏表示;然而,在实现的CvT-LSTM模型中,该模块使用16维隐藏表示。

四头集成: 方法部分未指明用于分析的架构实现为四头集成。在实现模型中,调制模块、核心模块和读出模块在四个头上独立参数化(共享视角变换和读出网格),通过对标准化对数响应的跨头平均得到预测结果。

调制模块: 方法部分指出调制网络接收三种行为输入(跑步机速度、瞳孔半径及瞳孔半径的导数);然而,在实现的CvT-LSTM模型中,仅使用了跑步机速度和瞳孔半径。此外,方法部分将LSTM隐藏状态和细胞状态描述为8维;在实现模型中,Conv-LSTM变体中的这些状态为6维,CvT-LSTM变体中为16维。

核心模块(前馈): 方法部分指出前馈DenseNet块使用GELU非线性激活;然而,在实现的Conv-LSTM模型中,前馈组件使用ELU,而CvT-LSTM模型使用GELU。

核心模块(循环): 在本工作使用的某些Conv-LSTM模型变体中,循环模块额外接收关于视觉刺激的显式空间信息。为此,对视野中每个特征图元素位置进行编码的空间网格,在进入Conv-LSTM之前与前馈特征和调制向量进行拼接。

核心模块(方程): 在编辑过程中,方程块中引入了排版错误:若干项前添加了不必要的花括号 {,并且在若干项中卷积算子 (W_k * ) 被错误地添加为上标 (W_k^*)

作为对照,附带本次修订高亮标记的方法文件可作为补充信息获取。本文的HTML和PDF版本中已对文本和方程进行了修正。FINISHED