AI拯救抑郁症，是“救星”还是“噱头”？在传统诊疗体系难以覆盖所有人群的背景下，社交媒体正在成为观察心理健康的特殊窗口。

现如今，抑郁症已成为一个严峻的全球性公共卫生问题。今年1月，知名明星赵露思发长文，自曝患上抑郁症，并伴有躯体化症状，引发了广泛的网络讨论，微博上的#抑郁症超话#也已经积攒了110万的帖子。

在传统诊疗体系难以覆盖所有人群的背景下，社交媒体正在成为观察心理健康的特殊窗口。人们在网络上分享生活点滴、倾诉情绪，这些海量数据隐藏着未被识别的心理信号。

与此同时，AI机器学习和深度学习技术不断进步，AI在检测抑郁症迹象方面展现出了潜力。但仍然存在不少问题，比如数据集不够多样化、处理过程不一致，这些“拦路虎”让AI技术在抑郁症检测的推广举步维艰。

基于此，最近几名青年华人研究人员发布了一篇“教程”，详细介绍了如何收集和评估社交媒体上的心理数据，还有多种检测模型的构建和优化技巧，对于应对精神健康问题具有重要的意义。

当AI成为“心灵捕手”

实际上，用AI来检测精神疾病并非新技术。国内外数家大模型供应商、研究团队和公益机构利用AI技术抓取关键词，从海量数据中甄别高危自杀人群，并建立了日趋成熟的AI自杀干预机制。2024年，Character.AI宣布了一系列新的安全功能，如通过弹窗引导“流露出自残或自杀意图”的用户访问国家自杀预防生命线等。

通过机器学习和深度学习技术，辨别人们在社交媒体上的想法和情绪，有可能找出抑郁症的蛛丝马迹，比如经常发消极、抱怨的内容，或说话逻辑混乱，都有可能是抑郁症患者发出的“信号”。

但几位研究人员发现，当前检测抑郁症的AI技术，仍然存在许多技术漏洞——有的数据集不全面、不同来源的数据对不上号、评估的时候也困难重重，比如评估不平衡数据的指标存在不足，这些都会让检测结果不够准确。

此外，社交媒体上的语言数据具有高度的复杂性，包含大量的讽刺、隐喻、网络热梗和暗语，这给AI理解和分析数据带来了极大的困难。

为了解决AI检测精神疾病数据的问题，研究人员开展了一系列的研究，为创建可靠、准确的抑郁症检测模型提供了指导。

来源：

www.aminer.cn/pub/67a96d4…

值得注意的是，这些青年华人作者实践经验丰富，他们有的已经成为微软的应用科学家，有些现担任Meta的软件工程师，有的具有在微软、亚马逊和Facebook等巨头公司的丰富实习经历。

www.aminer.cn/profile/542…

AI检测抑郁症的研究实践

研究第一步是找数据。研究人员使用的是 Kaggle 上的情绪分析心理健康数据集，这些数据来自Reddit、Twitter 和 Facebook等多个社交媒体平台，关注的是心理健康话题。

在数据清洗阶段，研究人员先把文本的URL、HTML 标签这些噪音信息清理掉，再把所有字母统一变成小写，以此减少冗余。

接着，研究人员去除掉“the”“and” 等没有实质意义的词，还把单词变回原形，比如“running”变成“run”，方便后续提取特征。最后，用固定随机种子的两步随机抽样法，把数据集分成训练集、验证集和测试集，以确保模型训练的有效性和可验证性。

为了让AI学会检测抑郁症，研究人员还采用了多种ML和DL“学习模型”，包括逻辑回归、支持向量机（SVM）、基于树的模型（如随机森林和LightGBM）、ALBERT和GRU，用来分析和分类心理健康状态。

简单来说，逻辑回归模型就是把各种信息整理好，算出得抑郁症的可能性；支持向量机像是在数据里找一条最合适的分割线，把不同情况分开；随机森林模型像是一群“智慧树”，组织起来一起做判断；LightGBM能高效处理大量数据；还有 ALBERT 和 GRU 这些深度学习模型，特别擅长理解复杂的语言。

研究人员还通过网络搜索或随机搜索的方法，精心调整这些模型的参数，让它们能更准确地检测抑郁症，最后采用了许多靠谱的评估指标，比如精度、召回率、F1 评分等，全面检查模型的能力。

经过一系列的研究与实践，研究人员发现，在判断是否患有抑郁症（正常与异常）这样的二元分类任务中，以及抑郁、焦虑等多个心理健康类别这样的多类分类任务中，模型的类别分布并不平衡，正常、抑郁和自杀等类别占主导，而且深度学习模型在捕捉复杂语言模式方面表现稍好。

然而，在识别抑郁症这一类别时，所有模型均面临挑战，抑郁症相关的AUROC分数相对较低，这表明在准确区分抑郁症方面，仍然存在亟需解决的困境。

总结

“冰冷”的算法，也有可能成为最先察觉藏在数据背后的抑郁情绪的帮手。

总的来说，这项研究成果带给了我们启示意义，它提供了一套切实可行的研究方法，能够让AI更为高效地识别出社交媒体中潜在的精神疾病患者，也启示研究者们可以通过丰富数据多样性、优化模型和评估指标等操作，让AI检测抑郁症更具普遍性，发挥更大的人文价值。

在这条科技与人文交织的道路上，我们既要追求更精准的模型，也要守护人性的温度。