MARCH多智能体框架,入选ACL 2026 主会议!

1 阅读4分钟

2026年4月17日,威尔康奈尔医学院等机构发布了论文,提出了一种名为MARCH(Multi-Agent Radiology Clinical Hierarchy)的新架构。不同于传统模型作为单一的“黑盒”系统进行端到端生成,缺乏迭代验证和跨检查机制,MARCH是一种共识驱动的多智能体框架,它明确模拟了放射科读片会中住院医师-专科医师-主治医师的层级协作结构。

(图片由AMiner 「AI 阅读」一键生成论文网页辅助整理)

该架构的核心创新点与价值在于其三大阶段设计:

首先由住院医师智能体利用多区域分割模块进行多尺度CT特征提取以生成初稿;

其次通过多个检索智能体和专科医师智能体利用图像、文本和Logit三种检索范式进行检索增强修订;

最后由主治医师智能体编排基于立场的迭代共识话语,以解决诊断差异并最终定稿。

这种模拟人类临床工作流的组织结构显著增强了AI在高风险医疗领域中的可靠性,在RadGenome-ChestCT数据集上,MARCH在临床保真度和语言准确性方面均显著超越了现有最先进的基线方法。

研究背景

医学影像(尤其是胸部三维CT等体积数据)的解读是现代诊断医学的基石,但生成准确、全面且临床有效的放射学报告在认知上要求极高,并已成为临床工作流中的主要瓶颈。

尽管大语言模型和视觉语言模型在自动化放射学报告生成方面展现出潜力,但这些方法通常作为单一的“黑盒”系统运行,存在很多缺陷。现有的大多数自动化报告生成系统并未对这种多智能体审查过程进行建模,而是依赖于端到端的黑盒生成,导致AI系统与专业临床工作流之间存在显著鸿沟。此外,虽然多智能体系统已被应用于医疗诊断、治疗推荐和医学图像分析等领域,但其在三维放射学报告生成任务中的应用仍然探索不足。

因此,该论文的研究背景正是为了弥补这一关键差距,通过显式建模放射科读片会的层级与协作结构,来解决当前自动化三维报告生成中缺乏协作监督和迭代验证的痛。

(图片由AMiner 「AI 阅读」一键生成论文网页辅助整理)

方法/架构设计

研究团队提出MARCH(多代理放射学临床层次结构),一个多代理框架,模拟放射科部门的职业层次,并为不同的代理分配专业角色,包括居民代理进行初步起草、多位专家代理进行检索增强修订和主治代理进行基于立场共识的迭代讨论以解决诊断差异。

(图片由AMiner 「AI 阅读」一键生成论文网页辅助整理)

实验设置

为验证 MARCH框架的有效性,研究团队在RadGenome-ChestCT数据集上评估了 MARCH,其在临床真实性和语言准确性方面显著优于最先进的基线模型,证明了模拟人类组织结构可以增强AI在高风险医疗领域的可靠性。

(图片由AMiner 「AI 阅读」一键生成论文网页辅助整理)

结论

MARCH创新性地将放射科“住院-专科-主治”层级工作流引入多智能体框架,有效解决了传统单模型“黑盒”生成的幻觉与缺乏迭代验证问题。其多模态检索增强与基于立场的共识机制显著提升了临床保真度,在18项异常检测中CE-F1达0.399,全面超越SOTA基线。目前,该论文已被ACL 2026 主会议接收。

MARCH 将放射科医师层级化诊疗工作流与多智能体框架深度融合,不仅突破了单模型在医学场景下的生成幻觉与可靠性瓶颈,更为 AI 辅助临床诊断提供了可解释、可验证的全新范式。其在多项关键指标上实现对当前最优方法的全面超越,也印证了层级化协作机制在高风险、高严谨性医疗 AI 领域的巨大价值。该论文已被 ACL 2026 接收,既体现了学术认可度,也为多智能体技术落地真实临床场景迈出了坚实一步。

本文多处使用AMiner AI科研工具辅助整理论文要点。