医疗保健中的深度学习--医疗界的希望之光
saptarshi41 ,2021年8月9日
文章视频书
这篇文章是作为数据科学博客马拉松的一部分发表的
目标
热烈欢迎所有的读者。这篇文章是关于探索人工智能在医疗科学和保健领域复兴的可能性。从传统方法中进行范式转变是提高病人治疗质量的当务之急。 这篇文章对那些试图进入医疗和保健领域的人工智能工作者和那些试图进入人工智能领域的医疗和保健科学工作者来说是非常有益的。
图片来源。弗兰德斯疫苗。 法兰德斯.健康系列的在线Pitch&Match会议 - 法兰德斯疫苗
内容
1.简介
a)什么是深度学习?
b)涉及的医疗条件/程序
c)有人类干预的真实事件
2.与深度学习代码的联系
3.从传统方法向机器驱动方法进行范式转变的原因
4.深度学习方法
5.深度学习在解决相关医疗条件和由这些条件引起的并发症中的作用
6.理解TREWS及其应用
7.深度学习在医疗和保健领域的挑战
8.结论
9.参考文献
1.简介
a)什么是深度学习?
深度学习可以作为一种有力的工具,用来识别我们身体中某些状况的发展模式,比临床医生快得多。深度学习通过数据输入、权重和偏差的组合来模仿人脑的工作机制。对数据进行聚类并作出高度准确的预测仍然是深度学习的基本机制。
b)涵盖的医疗条件/程序
1.甲状腺切除术- 1.切除甲状腺或抑制其功能被称为甲状腺切除术。腺体是一种专门分泌新陈代谢不需要的物质的细胞聚集。甲状腺是我们体内的腺体之一,它分泌负责新陈代谢的甲状腺素(T4)和三碘甲状腺素(T3)。
2.心血管疾病- 心血管指的是心脏和血管,任何与之相关的情况
,都被称为心血管疾病。常见的心血管
疾病有心绞痛、心律失常、充血性心力衰竭、
心肌梗死、冠状动脉功能不全和高血压。
3.败血症- 血液或其他组织中存在致病有机体。当感染在血液中释放化学物质,引发负面的炎症反应,导致主要器官衰竭时就会发生。
**c)传统方法的一个真实事件
**
一位52岁的女性因主诉脚痛而被送入巴尔的摩医院急诊室。她被诊断为脚趾干性坏疽,被送入普通病房。第三天,她出现了肺炎的症状,按照惯例,治疗路线是使用抗生素。3天后,她出现了心动过速(心率升高),同时呼吸加快。在12小时内,她的病情恶化,进入了败血症休克。她被转移到ICU,但她的主要器官开始相继衰竭,最后,在第22天,她去世了(Ashley,2017)。
根据约翰霍普金斯医学院阿姆斯特朗病人安全和质量研究所的一名医生,脓毒性休克是一种威胁生命的疾病,死亡率为50%,一小时的脓毒症未得到治疗,死亡率就会增加8%。因此,临床医生必须快速诊断这种情况。但是,随着临床医生队伍的短缺,如何实现这一目标?答案是使用 "机器"。在接下来的章节中,我们将讨论使用机器来管理每个给定条件的有用性。
2.与深度学习代码的联系
为了熟悉绳索,下面给出了以循序渐进的方式理解深度学习代码的链接
3. 从传统方法向机器驱动的方法进行范式转变的原因
医院设置的病人结果的质量处于破旧状态。从这位女士因疼痛而入院的结果可以看出,为了改善病人的结果,必须进行范式转变。从传统的方法向机器驱动的方法过渡的原因是:
a) 临床医生的劳动力不足以满足日益增长的具有不同情况的人口。
b) 难以扩大临床医生的规模,但容易扩大机器的规模。
c) 私立医院的消费主义做法影响了病人的治疗质量。
d) 官僚主义瓶颈,特别是在政府控制的医院,导致健康状况不佳。
机器驱动的方法将不受上述所有限制的影响,因此,有可能带来更好的结果。
4.深度学习方法
这个概念来自于人工神经网络(ANN)。关键是建立几个隐藏层,并产生大量的训练数据,这将使机器能够学习更多有用的特征,以便更好地预测和分类。Ravi等人(2017)提出的不同类型的深度学习架构、相关图像及其特征讨论如下
| S.编号 | 深度学习的架构类型 | 特征 |
| 1 | 深度神经网络 | 1.用于分类或回归 2.涉及2个以上的隐藏层 3.复杂,允许表达非线性的假设。 4.学习过程非常缓慢 5.训练不是小事 |
图片来源。Ravi等人(2017) ieeexplore.ieee.org/stamp/stamp…
| S.编号 | 深度学习的结构类型 | 特点 |
| 2 | 深度自动编码器 | 1.用于特征提取或降维 2.相同数量的输入和输出节点 3.无监督的学习方法。 4.训练时不需要标记的数据 5.需要一个预训练阶段 |
图片来源。Ravi等人(2017) ieeexplore.ieee.org/stamp/stamp…
| S.编号 | 深度学习的结构类型 | 特点 |
| 3 | 深度信念网络 | 1.允许对网络进行有监督和无监督的训练 2.仅在顶部2层有不定向的连接 3.逐层贪婪的学习策略来启动网络 4.可能性最大化 5.计算成本高的训练过程 |
图片来源。Ravi等人(2017) ieeexplore.ieee.org/stamp/stamp…
| S.编号 | 深度学习的结构类型 | 特点 |
| 4 | 深度玻尔兹曼机 | 1.网络各层之间存在的连接没有正确的 。 2.应用随机最大似然算法来最大化似然的下限。 3.涉及到自上而下的反馈 4.推理的时间复杂度较高 5.对于大数据集的优化并不务实 |
图片来源。Ravi等人(2017) ieeexplore.ieee.org/stamp/stamp…
| S.编号 | 深度学习的架构类型 | 特点 |
| 5 | 递归神经网络 | 1.用于输出取决于先前的计算。 2.记忆连续事件的能力 3.对时间依赖性进行建模的能力 4.适用于NLP(自然语言处理)应用 5.频繁的学习问题 |
图片来源。Ravi等人(2017) ieeexplore.ieee.org/stamp/stamp…
| S.编号 | 深度学习的结构类型 | 特点 |
| 6 | 卷积神经网络 | 1.适用于图像等二维数据 2.每个卷积过滤器将其输入转换为神经元激活的三维输出量 3.需要有限的神经元连接 4.需要很多层来找到视觉特征的完整层次结构 5.需要由标记图像组成的大型数据集 |
图片来源。Ravi等人(2017) ieeexplore.ieee.org/stamp/stamp…
5.深度学习在解决相关医疗条件和这些条件产生的并发症中的作用
让我们来谈谈一开始提到的前两个医疗程序/条件,看看深度学习在这些条件中的作用。
1.甲状腺切除术-
在甲状腺切除术中,识别_喉返神经(RLN)_是最重要的。喉返神经与喉部(声门)有关,是迷走神经的一部分,供应所有内部肌肉。在甲状腺切除术中,将RLN与小口径血管区分开来是非常重要的。由于缺乏经验的外科医生的工作,术后并发症的发生率相当高。计算机视觉工具能否使外科医生以更好的方式识别RLN?让我们来看看
Gong等人(2021)提出的深度学习的方法/模型,其程序和结果应用于RLN的识别,讨论如下
| 数据集--使用数码单反相机(Nikon 3000)和智能手机(Apple)获得的来自130名患者的277张图像。 | ||||
| S.编号 | 方法/模型 | 程序 | 结果 | 备注 |
| 1 | 分割 | 标有远景或近景图片距离的图片->头颈部内分泌外科医生对每张图片的神经分割进行手动注释->使用DSC(Dice相似性系数)对基础事实外科医生的注释进行定量评估,应用k倍交叉验证(k=5)。 | DSC = 2TP/(2TP+FP+FN)其中TP = 真阳性;FP = 假阳性,FN = 假阴性 DSC是分割的主要指标。 | |
| 2 | 裁剪模型 | 裁剪的图像集中在感兴趣的外科解剖结构上->裁剪的图像由神经分割模型分割->AP(平均精度)指标被报告,范围从0到1,AP>0.5被认为是一个好模型 | AP(跨越所有5个折叠)= 0.756 AP(远处图像)= 0.677 AP(近距离图像)= 0.872 | |
| 3 | 神经分割模型 | 与裁剪模型类似 | DSC范围= 0.343(+/- 0.077, n=78, 95% CI) to 0.707(+/- 0.075, n=40, 95% CI) | 在远处明亮的闪电下得到的DSC最低,在近处中等照明下得到的DSC最高。 |
| 4 | 神经宽度估计 | 与上述模型类似,但图像是用陆军-海军缩略图说明的,最大宽度的估计是由地面实况(gt)和预测的神经分割(pr)得出的。 | 使用不同的自动剪裁的输入图像和预测分割的估计: i) gt=1.434毫米,pr=1.009毫米ii) gt=3.994毫米,pr=3.317毫米 iii) gt=3.184毫米,pr=3.634毫米 iv) gt=3.485毫米, pr=3.203毫米 |
可以推断出,两者得出的估计结果是相似的。涉及端到端训练和推理管道的整个过程的说明可以在下面的图片中看到
图片来源。Gong等人(2021) www.nature.com/scientificr…
这些有希望的结果表明,深度学习有能力为外科医生进行甲状腺手术提供洞察力。
2.心血管疾病-
对心脏疾病的正确诊断是阻止不良后果的关键。深度学习有可能有效地诊断出关键因素。让我们看看它是如何做到的。
心脏超声成像的深度学习管道有三个部分,即数据的采集和预处理,网络的选择,以及训练和评估(Cao等人,2019)。该过程的流程图见下图
| 1.以DICOM格式收集的医学图像 2.图像转换为JPG/PNG格式 3.通过去除不良质量、去噪和标记进行预处理 4.选择网络,最好是来自Keras或SGD的152层ResNet和Dropout优化技术。 5.根据网络调整参数以优化性能 6.测试网络 NB:DICOM=医学数字成像和通信 |
Cao等人(2019)提出了一些利用深度学习进行心脏图像分割和心脏图像分类的研究内容。这些内容在以下表格中进行了总结
| 作者 | 年份 | 数据集 | 分割内容 | 方法 | 骰子 |
| 白文佳等人 | 2017 | 英国生物库研究 | 短轴心脏 | 半监督学习 | 0.92 |
| Ozan Oktay等人 | 2017 | 英国数字心脏项目 | 短轴心脏 | ACNN | 0.939 |
| Yakun Chang et a | 2018 | ACDC | 短轴心肌 | FCN | 0.90 |
| 作者 | 年份 | 数据集 | 分类内容 | 分类方法 | 准确率 |
| Lasya PriyaKotu等人 | 2015 | 作者自制数据 | 心律失常的风险 | k-NN | 0.94 |
| Houman Ghaemmaghami等人 | 2017 | 作者自制数据 | 心声 | TDNN | 0.95 |
| Ali Madani et al | 2018 | 作者自制数据 | 超声心动图的视图 | CNN | 0.978 |
深度学习已经发展成为预测心血管疾病隐藏模式的重要工具,可能有助于早期诊断危急情况。
6.了解TREWS及其应用
败血症是一种致命的病症,尽管临床医生的武器库中有大量的抗生素,但仍然难以治疗。早期诊断是关键,正如研究人员所观察到的和我们一开始看到的例子所显示的,即使延迟一小时也会使死亡率增加8%。早期积极治疗对改善死亡率很重要,但在现有的临床工具下,很难预测谁会患上败血症及其相关表现。
_TREWS(目标实时预警评分)_已被证明是准确和快速诊断败血症的答案。Henry, Hager, Pronovost, & Suria (2015)通过将一种方法应用于MIMIC-II临床数据库开发了一个模型。根据SSC(Surviving sepsis campaign)指南,器官功能障碍或更具体的SIRS(Systemic inflammatory response syndrome)被定义为存在4个标准中的任何2个,即
i)收缩压2.0mmol/L;尽管有足够的水合作用,但尿量<0.5mL/kg超过2小时。
ii)如果没有肾功能不全,血清肌酐>2.0mg/dL
iii)如果没有任何肝病,胆红素>2mg/dL
iv)急性肺损伤,有肺炎时PaO2/FiO2<200,没有肺炎时PaO2/FiO2<250
根据Henry, Hager, Pronovost, & Suria (2015),开发模型的步骤如下
1)数据集的分离
随机抽样,将数据隔离为开发集和验证集。
开发集=13181名患者(1836名阳性患者,11178名阴性患者,
,167名患者在治疗后有权利删减)
验证集=3053名患者(455名阳性患者,2556名阴性患者,
42名患者在治疗后有权利删减)
被称为阴性病例的患者是那些没有发生脓毒性休克。
2)模型开发
首先,对病人特定的测量流进行处理,以计算出分类为生命、临床和实验室组的特征。随后,应用监督学习算法对目标预警评分中使用的系数进行估计。学习算法自发地选择对脓毒性休克有预测作用的特征,并输出由预测特征列表及其系数组成的模型。
2.1) 估算模型系数
使用Cox-proportional hazards模型的监督信号是利用脓毒性休克发生前的时间来拟合的。休克的风险是由两部分计算出来的,如下式所示
λ(t |X) = λ0t*exp{XβT}。
X=特征,t=时间,λ0=时变基线危险函数,β=回归系数
这个模型的局限性在于未知或删减的事件时间。因此,基于多重归因的方法被用来解决Cox比例危险模型的模型参数估计,因为它 很容易实现。从 发展数据集的_N个_ 副本中的每一个 ,训练一个单独的模型。通过对第一个采样数据集进行10倍交叉验证,发现正则化参数为0.01,并固定为这个值用于训练后续模型。
最后,应用Rubin方程结合所得到的预测结果,计算出最终的风险值,作为 N个 模型中每个输出的风险值的平均值 。
3)模型评估
从开发集获得的模型系数被固定下来,应用于验证集的患者,就像他们
,进行前瞻性观察一样。随着新数据的出现,对验证集中的每个病人重新计算TREWScore,从而得出每个人的脓毒性休克的时间点风险。对于一个固定的风险阈值,如果一个人的风险轨迹在败血症休克发生前曾经上升到检测阈值以上,则被确定为败血症休克的高风险,并计算敏感性和特异性。
4)结果
算法选择了最能表明脓毒性休克的特征子集,并为它们学习了一套权重。每个时间点的特征被标记为发病时间,即距脓毒性休克发病的小时数(图1),并用于生成随时间变化的TREWScore风险预测(图2)。
图1 .图片来源。Henry, Hager, Pronovost, & Suria (2015) stm.sciencemag.org
图2.图片来源。Henry, Hager, Pronovost, & Suria (2015) stm.sciencemag.org
通过TREWS,中位领先时间超过24小时,使临床医生有时间在败血症转为脓毒性休克之前进行干预。
深度学习在医疗和保健领域的挑战
1.数据不足有时会导致准确性低
2.深度学习模型的可解释性问题使其成为一个黑盒子
3.罕见病的特定疾病数据的局限性
4.许多时候,原始数据不能直接作为DNN的输入
5.DNN很容易被欺骗,在输入样本中添加一些小的变化,导致错误分类。
结论
医疗保健部门正在从基于纸张的记录向电子健康记录(EHR)转变。这将为深度学习在这一领域的应用打开机会的大门,并彻底改变医疗和保健系统。这将改善病人与医生的互动,从而改善医院的健康状况。深度学习将是未来临床医生在医学领域取得成功的关键。
参考文献
1.Ashley, S. (2017).使用人工智能来发现医院的沉默杀手。NOVA。取自www.pbs.org/wgbh/nova/a…
2.Cao, Y et al. (2019).心血管疾病的深度学习方法.Journal of Artificial Intelligence and Systems.Retrieved fromiecscience.org/journals/AI…
3.Gong, J et al. (2021)._在甲状腺切除术中使用深度学习来识别喉返_神经。科学报告》。摘自www.nature.com/scientificr…
4.Henry, K, E., Hager, D, N., Pronovost, P, J., & Suria, S. (2015).脓毒症休克的针对性实时预警评分(TREWScore)。Science Translational Medicine.取自stm.sciencemag.org
5.Ravi, D et al. (2017).Deep Learning for Health Informatics.IEE Journal of biomedical and health informatics.Retrieved fromieeexplore.ieee.org/stamp/stamp…
6.Richards, S. (2019)._约翰霍普金斯大学针对败血症的早期预警_算法。John Hopkins Medicine.Retrieved fromwww.hopkinsmedicine.org/news/articl…
本文所展示的媒体不属于Analytics Vidhya所有,由作者自行决定使用。
标签 :医疗保健中的人工智能, 博客马拉松, 深度学习
[
下一篇文章
用Python开发向量自动回归模型!
](www.analyticsvidhya.com/blog/2021/0…
上一篇
如何用Python构建一个价格推荐的应用程序
](www.analyticsvidhya.com/blog/2021/0…)