Performance measure characterization for evaluating neuroimage segmentation algorithms
abstract
由于神经解剖结构的复杂性、图像质量的高以及对分割精度的要求,如何表征脑图像分割算法的性能一直是一个难题。利用与敏感性和特异性相关的Jaccard和Dice相似系数来评价分割算法的性能,已经引起了广泛的兴趣。本文论述了评价框架中采用的基本性能度量系数的本质特征。在研究Jaccard、Dice和特异系数特性的基础上,提出了一种新的度量系数一致性和敏感性的图像分割方法。结果表明,一致性比Jaccard和Dice更敏感、更严格,在分割图像的小变化检测中具有更好的识别能力。与特异性相比,敏感性在不考虑图像背景属性的情况下提供了一致可靠的评价分数。通过使用不同的分割技术从大量的大脑图像中提取神经解剖结构,说明了所提系数的优点。
主要讲目前存在jaccard和dice,本文在此基础上又提出新方法,最后在脑部图片上验证
Introduction
图像分割是将图像分割成有意义的对象的过程,每个区域都具有相似的特征,这些特征通过灰度和纹理反映出来。它是神经图像分析的关键预处理步骤,如特征提取、形状表征和测量以及图像理解。随着医学成像方法的速度和分辨率的最近进展以及对脑成像程序的日益要求,计算机辅助促进图像数据的处理和分析已变得重要和必要。在病理定位、定量容积评估、手术治疗规划、计算机辅助诊断与手术、脑成像、血管成像、三维可视化等临床和研究应用中,对脑图像解剖和病理结构的分割需求急剧增加。
废话概述重要性
几十年来,人类和动物大脑图像分割技术被广泛提出,包括基于阈值、基于区域、基于统计、分类、可变形模型、atlas引导技术和基于知识的方法.到目前为止,还没有普遍接受的分割技术,可以在广泛的神经图像处理应用中产生令人满意的结果。大多数算法都做了一些基本假设,限制了它们在特定问题和应用程序(Dawant)中的使用.在脑图像分析中,分割仍然是一个具有挑战性的问题,而对分割算法的评价一直处于滞后状态
可以想象,这种滞后是由于难以定义性能系数和统计数字、难以制定黄金标准以及难以收集冗长和费时的数据不过,已经提出了一些评价方法。Zhang(1996)提出了一种理想的评价方法,包括研究不同分割算法的通用性、定量测量能力和客观评价能力。客观研究应排除人为因素的影响,提供一致性和无偏倚的结果。此外,一个好的评价方法应该能够检测出分割图像中的小变化。
评价方案通常是根据分割的目标。为特定的应用程序设置适当的系数是成功评估的关键。如果分割的目的是测量神经解剖结构的体积,体积误差分析可以满足需要。对于分析性和系统性的评价,需要更复杂的方法。张(1996)将系统评价方法分为两大类:分析方法和实证方法。分析方法直接根据分割算法的原理和性质对其进行检验和分析,而经验方法则采用间接判断的方法,将分割算法应用于图像的检测和结果质量的测量。
最近,一些研究人员提出了一份描述图像分割算法性能的准确性、精密度和效率的报告。准确性是指分割结果与代表真实分割的参考标准的比较程度。精度是指对相同的图像数据进行分割的重复性。效率提供了关于算法实际应用的信息,例如计算复杂度和处理时间。
精度和精度评价可分为广义的两类分为基于距离的系数、基于区域的系数和对整个图像的统计分析。为了适应各种评估情况,可以使用与统计推断相关的多个系数,例如类内相关系数。基于距离的系数[例如。其中,Hausdorff距离是在边界划分至关重要时,基于分割轮廓(或三维曲面)与真实边界之间距离的度量。另一方面,当目标面积(或体积)的大小和位置测量是分割的关键和目标时,使用基于区域的系数。Cox和Cox(2000)对各种基于区域的相似系数进行了广泛的研究,其中部分内容如表1所示。
Table 1
Similarity coefficients for region-based evaluation.
