AI拯救抑郁症,是“救星”还是“噱头”?

231 阅读5分钟

现如今,抑郁症已成为一个严峻的全球性公共卫生问题。今年1月,知名明星赵露思发长文,自曝患上抑郁症,并伴有躯体化症状,引发了广泛的网络讨论,微博上的#抑郁症超话#也已经积攒了110万的帖子。

在传统诊疗体系难以覆盖所有人群的背景下,社交媒体正在成为观察心理健康的特殊窗口。人们在网络上分享生活点滴、倾诉情绪,这些海量数据隐藏着未被识别的心理信号。

与此同时,AI机器学习和深度学习技术不断进步,AI在检测抑郁症迹象方面展现出了潜力。但仍然存在不少问题,比如数据集不够多样化、处理过程不一致,这些“拦路虎”让AI技术在抑郁症检测的推广举步维艰。

基于此,最近几名青年华人研究人员发布了一篇“教程”,详细介绍了如何收集和评估社交媒体上的心理数据,还有多种检测模型的构建和优化技巧,对于应对精神健康问题具有重要的意义。

当AI成为“心灵捕手”

实际上,用AI来检测精神疾病并非新技术。国内外数家大模型供应商、研究团队和公益机构利用AI技术抓取关键词,从海量数据中甄别高危自杀人群,并建立了日趋成熟的AI自杀干预机制。2024年,Character.AI宣布了一系列新的安全功能,如通过弹窗引导“流露出自残或自杀意图”的用户访问国家自杀预防生命线等。

通过机器学习和深度学习技术,辨别人们在社交媒体上的想法和情绪,有可能找出抑郁症的蛛丝马迹,比如经常发消极、抱怨的内容,或说话逻辑混乱,都有可能是抑郁症患者发出的“信号”。

但几位研究人员发现,当前检测抑郁症的AI技术,仍然存在许多技术漏洞——有的数据集不全面、不同来源的数据对不上号、评估的时候也困难重重,比如评估不平衡数据的指标存在不足,这些都会让检测结果不够准确。

此外,社交媒体上的语言数据具有高度的复杂性,包含大量的讽刺、隐喻、网络热梗和暗语,这给AI理解和分析数据带来了极大的困难。

为了解决AI检测精神疾病数据的问题,研究人员开展了一系列的研究,为创建可靠、准确的抑郁症检测模型提供了指导。

来源:

www.aminer.cn/pub/67a96d4…

值得注意的是,这些青年华人作者实践经验丰富,他们有的已经成为微软的应用科学家,有些现担任Meta的软件工程师,有的具有在微软、亚马逊和Facebook等巨头公司的丰富实习经历。

www.aminer.cn/profile/542…

AI检测抑郁症的研究实践

研究第一步是找数据。研究人员使用的是 Kaggle 上的情绪分析心理健康数据集,这些数据来自Reddit、Twitter 和 Facebook等多个社交媒体平台,关注的是心理健康话题。

在数据清洗阶段,研究人员先把文本的URL、HTML 标签这些噪音信息清理掉,再把所有字母统一变成小写,以此减少冗余。

接着,研究人员去除掉“the”“and” 等没有实质意义的词,还把单词变回原形,比如“running”变成“run”,方便后续提取特征。最后,用固定随机种子的两步随机抽样法,把数据集分成训练集、验证集和测试集,以确保模型训练的有效性和可验证性。

为了让AI学会检测抑郁症,研究人员还采用了多种ML和DL“学习模型”,包括逻辑回归、支持向量机(SVM)、基于树的模型(如随机森林和LightGBM)、ALBERT和GRU,用来分析和分类心理健康状态。

简单来说,逻辑回归模型就是把各种信息整理好,算出得抑郁症的可能性;支持向量机像是在数据里找一条最合适的分割线,把不同情况分开;随机森林模型像是一群“智慧树”,组织起来一起做判断;LightGBM能高效处理大量数据;还有 ALBERT 和 GRU 这些深度学习模型,特别擅长理解复杂的语言。

研究人员还通过网络搜索或随机搜索的方法,精心调整这些模型的参数,让它们能更准确地检测抑郁症,最后采用了许多靠谱的评估指标,比如精度、召回率、F1 评分等,全面检查模型的能力。

经过一系列的研究与实践,研究人员发现,在判断是否患有抑郁症(正常与异常)这样的二元分类任务中,以及抑郁、焦虑等多个心理健康类别这样的多类分类任务中,模型的类别分布并不平衡,正常、抑郁和自杀等类别占主导,而且深度学习模型在捕捉复杂语言模式方面表现稍好。

然而,在识别抑郁症这一类别时,所有模型均面临挑战,抑郁症相关的AUROC分数相对较低,这表明在准确区分抑郁症方面,仍然存在亟需解决的困境。

总结

“冰冷”的算法,也有可能成为最先察觉藏在数据背后的抑郁情绪的帮手。

总的来说,这项研究成果带给了我们启示意义,它提供了一套切实可行的研究方法,能够让AI更为高效地识别出社交媒体中潜在的精神疾病患者,也启示研究者们可以通过丰富数据多样性、优化模型和评估指标等操作,让AI检测抑郁症更具普遍性,发挥更大的人文价值。

在这条科技与人文交织的道路上,我们既要追求更精准的模型,也要守护人性的温度。