AI 编程代理的演进阶段与执行模式
AI 编程代理的出现标志着一场巨大的变革,它使得构建软件的速度更快、更容易。通过分析 AI 编码方式的变化,我们可以将其归纳为三个主要的执行阶段:
阶段一:复制与粘贴 (The Copy-Paste Stage)
- 执行方式: 开发者将编码问题完整地输入到 ChatGPT 等工具中,获得结果后,将其复制并粘贴到集成开发环境(IDE)中。
- 洞察/总结: 这是 AI 辅助编程的萌芽期,发生在 2023 年左右。虽然提高了效率,但这种方式仍需要大量的人工干预和环境切换。
阶段二:编辑器内聊天与代码建议 (In-Editor Chatting)
- 执行方式: 开发者在编辑器内输入问题,AI 会提供潜在的代码建议供开发者应用。
- 洞察/总结: 这一阶段将 AI 引入了开发者的日常工作流,减少了环境切换,但 AI 仍然主要扮演助手的角色。
阶段三:编码代理主导开发 (Coding Agents Leading Development)
- 执行方式: 编码代理(如 Trey)开始出现,并主导整个开发过程。Trey 旨在成为 AI IDE,目前已支持全球数百万开发者。
Trey 的核心理念:从 AI IDE 到“上下文工程师”
Trey 团队在发展中意识到一个关键问题:传统的 IDE 是为人类设计的,而非为 AI 设计。为了让 AI 编写出正确且高效的代码,必须赋予它更多的上下文 (Context) 和权限 (Permission) 。
| 概念 | 描述 | 人类/AI 主导 | 组成要素 | 经验总结 (避坑指南) |
|---|---|---|---|---|
| AI IDE (初始) | AI 整合到 IDE 中。 | 人类主导整个过程。 | 访问代码、文件、文件夹和代码库。 | 如果仅将 AI 整合到 IDE 中,AI 会不断询问“我能安装这个包吗?”或“我能设置这个配置吗?”这不够智能。 |
| Trae 2/Solo (新) | AI 成为上下文工程师 (Context Engineer) 。 | AI 自动化处理开发模式。 | IDE 只是一个组件,同时整合了终端 (Terminal) 、文档视图 (Doc View) 、浏览器 (Browser) 、Figma 整合等关键环境和配置。 | 核心洞察: 要让 AI 编写有用的代码,必须向其提供所有必要且关键的上下文,如 PRD、设计、代码环境和外部配置等,才能做出决策。 |
Solo 将开发过程细分为六个重要组成部分,并让 Solo 负责处理所有这些环节:需求 (Requirement)、原型设计 (Prototyping)、前端开发、后端开发、调试优化 (Debugging Optimization) 和构建开发 (Build Development)。
结构化执行:Solo Builder vs. Solo Coder
Trae 推出了两种不同职责的代理,以应对不同的开发任务:
1. Solo Builder(0 到 1 的构建者)
-
职责定位: 专为从零开始设计您的想法、创建最简单的 MVP(最小可行产品)而生。
-
执行步骤与提示词示例:
- 输入创意: 用户只需输入想法,例如“生成一个电影网站”。
- 规划与跟踪: Solo 像产品经理一样开始思考和工作。用户可以点击“流程 (Flow)”按钮,查看 AI 正在执行的清晰图表,并进行编辑或修改。
- 环境控制与构建: Solo 控制终端和所有重要的环境配置设置。
- 实时预览与上下文: 网站直接在 Solo 内部显示,整个浏览器也成为 Solo 的上下文。
- 自动化调试: Solo 可以读取错误日志信息(如浏览器或终端中的错误),并自动进行调试。用户无需手动复制和粘贴错误信息,只需点击“添加到聊天 (Add to chat)”即可。
-
经验总结: Solo Builder 使得非专业编码者(Wiper Coder)也能轻松满足构建需求。其强大的功能(如代币消耗增长 700%)得益于其背后海量的上下文和工具。
2. Solo Coder(1 到 100 的完成者)
-
职责定位: 专为复杂和具有挑战性的任务而生。旨在帮助完成从原型到成熟产品的过程(1 到 100)。
-
核心执行模式:
-
启用规划模式 (Plan Mode): 每次 Solo Coder 开始编写代码时,可以开启规划模式。它会创建一个文档,展示 AI 打算做什么,让用户可以随时审查和互动。
-
响应式审查 (Responsive Review): 这是 Solo Coder 的关键特性,旨在让用户易于审查和理解 AI 的行为。
- Doc View: 查看 AI 编写代码的计划文档。
- Diff View: 清晰地查看 AI 正在对代码进行的修改,用户可以决定是否接受这些修改。
-
使用子代理 (Sub-Agents) 进行分工协作: Solo Coder 允许使用具备不同职责的子代理(如 QA 代理、测试代理、设计代理),实现多任务并行。
-
处理内部知识 (Internal Knowledge): 通过子代理和 MCP(Managed Context Provider),Solo 可以学习公司内部框架(如 Links)和工具,并像真人一样执行测试,同时确保内部知识不会泄露。
-
-
经验总结 (Responsive Agent 的价值):
- 避坑指南: 传统编码代理有时会写出一大堆代码,但你不知道它在做什么。响应式审查 (Responsive Review) 确保了所有修改都在你的控制之下,让你知道正在发生什么。
- 效率提升: 多任务处理 (Multitask) 允许同时启动多个任务,使得开发者能够像 10 倍甚至 100 倍效率的工程师一样工作,而无需等待。开发者的责任从优化具体代码转变为管理这些 AI 工程师。
Trae 的未来愿景与协作方式
Trey 的最终愿景是探索人类与 AI 协作的未来。就像你不会告诉坐在身边的同事“打开这个文件夹,编写这个文件”,而是直接说“我想做这个功能”,AI 工程师就会开始工作。
经验总结(评估与趋势):
- 性能评估挑战: 评估像 Solo 这样深度集成在 IDE 中、依赖大量上下文的 AI 代理的性能比评估基于 CLI 的代理要困难得多,因为几乎没有可比的参照物。
- 以人为本的评估: 除了技术指标(如 Sweetbench 排名第一的概率指标),Trae 还非常重视真实的人类体验。他们通过内部 Hackathon 和研讨会来评估用户感受,因为有时人类的真实感受比冰冷的指标更重要。
- 未来的交互趋势: 随着 AI 编码代理的升级,它们将更像真实的人类工程师。未来用户可能会通过语音控制(例如使用快捷键)来指导 Solo 完成开发工作,因为它比使用鼠标和键盘更方便。