一、前言
2025年10月,我们首次接触Skill技术时,就真切感受到了它的价值。当时我们正投身AI Agent开发,深陷一个核心困境:大模型有强大的抽象能力,却难以落地到具体业务——不同场景的能力模块杂乱无章,既无法复用,也难以协同。而Skill技术恰好能解决这个问题,它能把大模型能力拆解为独立、可调用的Skill模块,还能按业务需求灵活组合,让技术落地不再是“空中楼阁”。基于这份判断,我们快速启动调研,凭着对业务痛点的感知推进实践,到11月中旬就完成了多场景验证,顺带搭建起基础的Skill框架,攒下了第一波能直接复用的工程化经验。2026年1月,基于这些实践沉淀,我们决定走开源开放路线,计划把项目重构后落地到ooderAgent(MIT协议开源工程)。选择SDD(规范驱动开发)规范,对我们来说是倒逼自己跳出旧模式的尝试——此前开发全靠经验摸索,团队协作没统一标准,代码越写越乱,后续维护成本极高。SDD“先定规则、再生成代码”的思路,刚好能解决开源项目最核心的“规范化、可复用”问题。接下来,我就以团队视角,顺着开发轨迹,聊聊SDD在ooderAgent中的落地全流程,分享那些从实际踩坑、复盘里总结出的经验与感悟。
二、SDD与ooderAgent的适配根基
我们研发ooderAgent,本质是想做一款轻量化、标准化的开源Agent框架,解决自己和同行都遇到的多Agent协作乱、Skill集成无章法的问题。当前AI Agent技术发展快但缺乏统一标准,我们希望能提供一套经过实战验证、可直接复用的工程化方案。它的标准化架构不用额外改造,就能承接SDD规范,这也是我们最终选择它作为落地载体的核心原因。
1. 前期准备与规范模型
落地SDD前,我们没有搞复杂流程,只聚焦三项核心准备,为适配筑牢基础:一是对齐开源协议,确保SDD规范与ooderAgent框架兼容无冲突;二是细化业务场景,把模糊需求转化为明确范围,避免后期返工;三是守住架构底线,为分布式部署做好铺垫。基于这三点,我们引入ISPI四层规范模型(需求、系统、协议、实现),制定团队与AI共同遵循的执行规则,相当于为后续开发铺好了清晰的“轨道”。
2. 核心适配要点
适配过程中,我们紧盯三个关键节点,确保SDD不流于形式、真正落地:一是组件对齐,将ooderAgent的End Agent、Route Agent、MCP Agent与SDD分层规范一一对应,充分复用前期积累的Skill框架经验;二是界定Skill边界,通过SDD明确Skill的功能范围、调用方式及协作逻辑,避免大模型输入输出混乱;三是借力Scene/Group机制,提前预设协作规则,让同场景Agent自动组队通信,减少人工介入的麻烦。
三、SDD实操:以协议为核心的落地路径
做好适配铺垫后,我们按实际开发节奏优化了SDD落地流程,核心思路就是“先定死协议、再拆解需求、最后闭环落地”,每一步都围绕可执行性推进,全程清晰可控。
1. 协议打底:以MCP Agent为核心构建《协议接口基准文档》
开发的第一步,我们没有急于写代码,而是先联合团队敲定《协议接口基准文档》。全程以MCP Agent为中枢核心,刻意简化北上、南下协议逻辑,确保团队全员都能看懂、会用。MCP Agent承担着全局调度、协调的核心职责,所有协议都围绕它设计,从根源上杜绝了多组件间协议混乱、对接不畅的问题。其中,南下协议是上层系统向MCP Agent下发指令的通道,核心是明确“要做什么”——比如启动特定Skill任务、调整Agent协作关系、下发配置参数等,统一采用“指令类型+核心参数+执行时限”的简洁格式,摒弃冗余字段,保障MCP Agent快速解析执行。北上协议则是MCP Agent向上层反馈的通道,主要同步三类信息:任务执行进度与结果、系统运行状态(各Agent在线情况、资源占用)、异常告警(通信中断、任务失败及原因),让上层实时掌握系统动态。除此之外,文档还明确了MCP Agent与Route Agent、End Agent的内部通信规则,本质是将北上、南下协议的逻辑延伸至系统内部,确保指令精准传递、状态完整回传,整个协议体系简洁高效、无冗余设计。
2. 需求拆解与工程定位
协议定好后,我们以协议为基准,将需求拆分为五大模块,确保每一项都落到具体动作上:一是统一术语,避免团队沟通出现理解偏差;二是梳理业务元数据,明确各场景核心数据及流转规则;三是理清执行流程,让全员掌握任务从启动到收尾的完整链路;四是划定开发约束,明确敏感数据脱敏、分布式部署支持等硬要求;五是拆分工程职责,按Agent角色划分五个独立项目,明确各项目定位后,再对照需求逐一校验,确保任务无遗漏、责任到岗。
3. 架构搭建与代码生成
需求梳理清晰后,我们快速搭建系统骨架。技术路线选定Spring Boot,既能适配前期的分布式架构,又无需额外学习新框架,有效降低开发成本。我们重点打磨代码元数据模型,结合既定的术语与协议,明显感受到LLM对业务的理解更透彻了,生成的代码不仅规范,还能主动补充细节设计,大幅减少了人工优化的工作量。
4. 集成闭环与落地验证
各工程开发收尾后,我们围绕业务场景开展集成重构,将分散的模块整合归一,剔除冗余设计,优化组件间交互逻辑。随着整合推进,LLM对我们业务的认知持续深化,给出的方案也越来越贴合实际需求。最终落地时,我们采用“AI生成基础代码+人工优化核心逻辑”的模式,依托Trae Solo搭建测试环境,各工程先独立调试,无问题后再分批集成,收集全量日志开展回归测试,确保系统完全符合协议与需求标准。
四、实践总结与感悟
回望整个实践,ooderAgent的三层架构(执行-路由-管控)为SDD落地提供了坚实支撑:End Agent负责具体任务执行,Route Agent保障指令传递,MCP Agent统筹全局调度,三者各司其职且通过统一协议联动,精准解决了此前多Agent协作混乱的痛点。而我们搭建的核心组件体系,从Agent SDK、Skill Framework到VFS存储、UDP通信模块,均围绕“标准化、可复用”目标设计,与SDD理念高度契合,这也是二者能顺利融合的重要原因。实践中我们也踩了不少坑,好在都逐一找到了解决办法:多工程并行开发混乱,就用“角色拆分+协议分层”明确分工,规避协作冲突;长程任务反复重启,就拆解为原子异步任务,借助VFS保存状态,实现重启后无缝续行;不同大模型适配效果不均,就采用“主Skill+辅助Skill”模式优化;AI自测出现幻觉,就强制各Agent独立记录日志,汇总后交叉校验;UDP通信不稳定,就针对性补充保障机制。这些经历让我们明白,SDD不是万能的,但能为解决问题提供清晰框架,而ooderAgent的灵活性则赋予了我们调整优化的空间。这段旅程也让我们对技术边界有了更清醒的认知,摒弃了不切实际的幻想:SDD作为一种方法论,必须通过代码审查、测试校验等手段强制落地,无法自动生效;Agent自动建组需要基础配置铺垫,复杂集群关系仍离不开人工干预;Agent SDK仅提供基础能力封装,复杂业务逻辑还需自定义开发;现有工具对开源Agent生态的支持尚不成熟,诸多场景仍需自主探索。这些不足也指明了后续优化方向,我们计划在多模型适配、Skill协同调度、日志验证体系、边缘计算支持及可视化工具开发上持续深耕。总体而言,这次用SDD重构ooderAgent的尝试十分成功。我们不仅摆脱了“凭经验开发”的混乱状态,将开发流程纳入规范化轨道,更沉淀了一套能应对实际业务的开源Agent工程化方案。在AI Agent技术高速发展却缺乏统一标准的当下,ooderAgent的这些实践或许能给行业同仁提供一些实在参考,而SDD与开源框架的结合,也让我们看清了技术规模化落地的可行路径。我们期待与开源社区的伙伴们携手共建,在实际应用中不断完善方案,让AI Agent技术真正走进更多业务场景、创造实际价值。