AutoGluon智能助手：多智能体协作实现零代码自动机器学习本文介绍了一种创新的多智能体架构，通过感知、语义记忆、情景

AutoGluon智能助手：多智能体协作实现零代码自动机器学习

在2024年Kaggle AutoML Grand Prix大奖赛（一项奖金为75,000美元的竞赛，汇集了包括顶尖AutoML从业者和Kaggle特级大师在内的数百支队伍）中，全自动框架获得了第10名，成为该竞赛中唯一获得积分的自动化智能体。这一成就验证了长期以来探索的一个问题的答案：能否不仅消除通常与AutoML相关的模型选择和超参数调优，甚至消除编码本身？

自动机器学习的愿景一直是 democratization（普及化）。然而，大多数AutoML工具仍然要求用户编写代码、准备数据结构并理解ML工作流程。对于没有编程背景的领域专家（如分析实验数据的科学家、构建预测模型的分析师或处理图像集合的研究人员）而言，这种编码要求构成了不必要的障碍。

设计AutoGluon Assistant正是为了消除这一障碍。AutoGluon Assistant构建于MLZero之上，这是一个由大语言模型驱动的新型多智能体系统，它能够将自然语言描述转化为针对表格、图像、文本和时间序列数据的已训练机器学习模型。该系统在多模态AutoML智能体基准测试中取得了92%的成功率，在外部MLE-bench Lite测试中取得了86%的成功率，在成功率和解决方案质量方面均处于领先地位。

用于真正自动化的多智能体架构

传统的AutoML工具假定输入数据是干净、结构化的，并且用户能够正确调用API。现实世界中的机器学习问题始于更混乱的现实：模棱两可的数据文件、不明确的任务定义，以及可能不知道需要分类还是回归的用户。MLZero通过多智能体架构解决了这个问题，该架构中，由某机构Bedrock提供的大语言模型驱动的专用组件相互协作，将原始输入转化为可行的解决方案。

例如，考虑一位医学研究员上传带有分割掩码的胸部X射线图像，并描述目标为“定位X射线中的疾病区域”。感知模块识别出像素级分割是任务需求，语义记忆选择AutoGluon的MultiModalPredictor用于语义分割，迭代编码模块生成并优化代码。当初始尝试遇到掩码格式不兼容问题时，情景记忆提供调试上下文，以调整预处理和后处理步骤，最终成功训练出一个分割模型——整个过程无需研究员编写任何代码。

该系统包含四个核心模块：感知、语义记忆、情景记忆和迭代编码。

感知模块解释任意的数据输入，解析文件结构和内容以构建结构化的理解，无论格式不一致或命名模糊。例如，当用户提供的CSV文件没有明确指示目标变量时，感知模块会分析列的分布和语义来推断任务结构。
语义记忆模块用机器学习库的知识丰富系统，维护关于AutoGluon能力、API模式和实践的结构化信息。该模块使系统能够根据任务特征选择合适的工具，而无需用户知道语义分割任务需要AutoGluon Multimodal中的SAM模型。
情景记忆模块维护按时间顺序的执行记录，追踪系统尝试过什么、成功与失败。当代码执行产生错误时，此模块通过提供相关先前尝试及其结果来提供调试上下文。这解决了机器学习开发的迭代性质，其中解决方案通过精炼而非一次性形成。
迭代编码模块实施了一个带有反馈循环和增强记忆的精炼过程。生成的代码被执行，产生结果或错误，并为后续尝试提供信息。这个过程持续进行，直到成功执行或达到最大迭代次数，并可在需要时选择每轮接收用户输入以提供指导。该架构在保持高度自动化的同时，也为人工监督保留了灵活性。

通过这个综合系统，MLZero弥合了嘈杂原始数据与复杂机器学习解决方案之间的鸿沟。这种多智能体协作模式在多种模态下都证明是有效的，因为该架构分离了传统上在单智能体系统中相互交织的关注点——理解数据、了解能力、跟踪历史和生成代码。

成果分析

为了在一个已建立的外部标准上验证系统，首先在MLE-bench Lite上进行了评估。该基准测试包含21个来自过往Kaggle竞赛的多样化挑战，这使得能够直接将模型性能与其他领先的自动化系统进行比较。模型取得了最高的成功率——86%，意味着成功完成了21个挑战中的18个，并提交了有效解决方案。在整体解决方案质量上，模型也名列前茅，平均排名为1.43，而次优智能体的平均排名为2.36。智能体赢得了6枚金牌，并在基准测试挑战的总奖牌数上超过了所有竞争对手。

在已有基准测试上证明了模型能力后，进一步在自建的多模态AutoML智能体基准测试上进行了测试。这是一个更具挑战性的测试集，包含25个多样化的任务，数据集的处理程度更低，数据更接近原始形式，带有更多噪声、格式不一致和歧义。该基准测试涵盖了多种数据模态（表格、图像、文本、文档）和问题类型（分类、回归、检索、语义分割），以及具有挑战性的数据结构（多语言、多表和大型数据集）。AutoGluon Assistant（作为MLZero）在所有任务中取得了92%的成功率。当使用紧凑的80亿参数大语言模型实现时，系统仍然取得了45.3%的成功率，这证明它比许多更大、资源更密集的智能体更有效。

适应多样化工作流程的便捷接口

AutoGluon Assistant支持多种交互模式，以适应不同用户的偏好和工作流程。用户可以通过命令行界面调用系统以快速完成自动化任务，通过Python API集成到现有数据处理管道中，通过Web UI进行可视化交互和监控，或者使用模型上下文协议将其与其他智能体工具集成。这种灵活性确保无论用户偏好脚本编写、图形界面还是程序化控制，都能够访问相同的底层自动化能力。

系统还支持可选的每轮用户输入，允许领域专家在迭代精炼过程中注入专业知识，同时保持日常使用的自动化。例如，在处理医学影像数据时，专家可以引导系统根据特定的扫描协议进行自定义归一化。情景记忆会将这些干预与系统生成的尝试一同记录下来，创造出一种协作动态：自动化处理机械性复杂任务，而用户在拥有相关见解时贡献策略方向。

该系统已在某代码托管平台开源，技术细节发表在NeurIPS 2025论文中。FINISHED