智能体设计模式-附录 E - 命令行中的 AI 智能体这些强大的 AI 命令行智能体的出现标志着软件开发的根本转变，使终

英文原地址：Appendix E - AI Agents on the CLI

简介

开发者的命令行长期以来一直是精确、命令式指令的堡垒，如今正经历深刻变革。它正从一个简单的 shell 演变为由新一代工具驱动的智能协作工作空间：AI 智能体命令行界面（CLI）。这些智能体不仅仅执行命令；它们能够理解自然语言，保持对整个代码库的上下文，并能够执行复杂的多步骤任务，从而自动化开发生命周期中的大量工作。

本指南深入介绍这一新兴领域中的四位领先者，探讨其独特优势、理想使用场景和不同理念，帮助你确定哪款工具最适合你的工作流。需要强调的是，为某个特定工具提供的许多示例用例，通常也可以由其他智能体完成。区分这些工具的关键，往往在于它们在给定任务上所能实现的结果的质量、效率与细腻程度。已有专门的基准测试用于衡量这些能力，后续章节将进行讨论。

Claude CLI（Claude Code）

Anthropic 的 Claude CLI 被设计为一个高层次的编码智能体，对项目架构有深入而整体的理解。其核心优势在于“智能体化”的特性，能够为复杂的多步骤任务构建你的代码库的心智模型。交互方式高度对话化，类似结对编程会话，它会在执行前解释其计划。这使其非常适合专业开发者在大规模项目中进行重要的重构，或实现具有广泛架构影响的功能。

示例用例：

大规模重构： 你可以这样指示它：“我们当前的用户认证依赖会话 Cookie。将整个代码库重构为使用无状态 JWT，更新登录/登出端点、中间件，以及前端的令牌处理。”随后，Claude 会读取所有相关文件并执行协调一致的更改。
API 集成： 在提供了一个新的天气服务的 OpenAPI 规范后，你可以这样说：“集成这个新的天气 API。创建一个服务模块来处理 API 调用，添加一个用于显示天气的新组件，并更新主控制面板以包含它。”
文档生成： 针对一个文档较差的复杂模块，你可以请求：“分析 ./src/utils/data_processing.js 文件。为每个函数生成完整的 TSDoc 注释，说明其用途、参数和返回值。”

Claude CLI 作为一款专门的编码助手，内置了用于核心开发任务的工具，包括文件摄取、代码结构分析和编辑生成。它与 Git 的深度集成方便直接的分支和提交管理。该智能体的可扩展性由多工具控制协议（MCP）进行调度，用户可以定义并集成自定义工具。这使其能够与私有 API 交互、执行数据库查询以及运行项目特定脚本。这种架构将开发者置于智能体功能范围的裁决者位置，有效地将 Claude 定位为由用户定义工具增强的推理引擎。

Gemini CLI

Google 的 Gemini CLI 是一款兼顾强大与易用的多功能开源 AI 智能体。它凭借先进的 Gemini 2.5 Pro 模型、巨大的上下文窗口和多模态能力（处理图像和文本）而脱颖而出。其开源特性、慷慨的免费额度以及“推理与行动”（Reason and Act）循环，使其对于从业余爱好者到企业开发者的广大用户，尤其是身处 Google Cloud 生态的用户，成为透明、可控且全面出色的选择。

示例用例：

多模态开发： 你提供来自设计文件的网页组件截图（gemini describe component.png），并指示它：“编写 HTML 和 CSS 代码来构建一个看起来与此完全一致的 React 组件。确保它具有响应式能力。”
云资源管理： 利用其内置的 Google Cloud 集成，你可以下达命令：“查找生产项目中所有版本低于 1.28 的 GKE 集群，并生成一个 gcloud 命令逐一对它们进行升级。”
企业工具集成（通过 MCP）： 一位开发者为 Gemini 提供了一个名为 get-employee-details 的自定义工具，用于连接公司内部的 HR API。提示词为：“为我们的新员工起草一份欢迎文档。首先使用 get-employee-details --id=E90210 工具获取他们的姓名和团队，然后将这些信息填充到 welcome_template.md 中。”
大规模重构： 一位开发者需要对大型 Java 代码库进行重构，用新的结构化日志框架替换已弃用的日志库。他们可以对 Gemini 提示如下：读取 'src/main/java' 目录下的所有 *.java 文件。对于每个文件，将所有 'org.apache.log4j' 的导入及其 'Logger' 类替换为 'org.slf4j.Logger' 和 'LoggerFactory'。重写记录器实例化以及所有 .info()、.debug() 和 .error() 调用，使其使用带键值对的新结构化格式。

Gemini CLI 配备了一套内置工具，使其能够与环境交互。这些工具包括用于文件系统操作（如读写）的工具、用于运行命令的 shell 工具，以及通过网络获取与搜索访问互联网的工具。为了获得更广的上下文，它使用专门的工具一次读取多个文件，并提供一个内存工具将信息保存到后续会话中。此功能建立在安全基础之上：沙箱将模型的操作进行隔离以降低风险，而 MCP 服务器则充当桥梁，使 Gemini 能够安全地连接到你的本地环境或其他 API。

Aider

Aider 是一款开源的 AI 编码助手，通过直接在你的文件上工作并将更改提交到 Git，充当真正的结对程序员。它的核心特征是直接性；它会应用编辑、运行测试以验证它们，并自动提交每次成功的更改。由于对模型持中立态度，它让用户对成本和能力拥有完全的控制权。其以 Git 为中心的工作流使其非常适合重视效率、可控性以及对所有代码修改进行透明审计追踪的开发者。

示例用例：

测试驱动开发（TDD）： 开发者可以说：“为一个计算数字阶乘的函数创建一个失败的测试。”在 Aider 编写测试且测试失败后，下一条提示是：“现在，编写代码使测试通过。”Aider 实现该函数并再次运行测试以确认。
精准修复漏洞： 给定一份缺陷报告，你可以指示 Aider：“billing.py 中的 calculate_total 函数在闰年会失败。将该文件加入上下文，修复该漏洞，并通过现有测试套件验证你的修复。”
依赖更新： 你可以这样指示它：“我们的项目使用了过时版本的 ‘requests’ 库。请遍历所有 Python 文件，更新 import 语句和任何已弃用的函数调用以兼容最新版本，然后更新 requirements.txt。”

GitHub Copilot CLI

GitHub Copilot CLI 将流行的 AI 结对编程扩展到终端，其主要优势在于与 GitHub 生态的原生、深度集成。它理解 GitHub 中项目的上下文。其智能体能力允许它被分配一个 GitHub issue，着手修复，并提交一个供人工审查的 pull request。

示例用例：

自动化问题解决： 经理将一个缺陷工单（例如，“Issue #123：修复分页中的 off-by-one 错误”）分配给 Copilot 智能体。该智能体随后检出新分支、编写代码，并提交引用该 issue 的 pull request，全程无需开发者手动介入。
仓库感知型问答： 团队中的新开发者可以问：“在这个仓库的哪里定义了数据库连接逻辑？它需要哪些环境变量？”Copilot CLI 凭借对整个仓库的认知，提供带有文件路径的精确答案。
Shell 命令助手： 当不确定复杂的 shell 命令时，用户可以询问：gh? 查找所有大于 50MB 的文件，压缩它们，并将其放入 archive 文件夹。Copilot 会生成执行该任务所需的精确 shell 命令。

Terminal-Bench：用于命令行界面中 AI 智能体的基准测试

Terminal-Bench 是一个新颖的评估框架，旨在评估 AI 智能体在命令行界面中执行复杂任务的熟练程度。终端被认为是 AI 智能体运行的理想环境，因为其基于文本且具有沙盒特性。初始发布版本 Terminal-Bench-Core-v0 包含 80 个手工策划的任务，覆盖科学工作流、数据分析等领域。为确保公平比较，开发了一个极简智能体 Terminus，作为各类语言模型的标准化测试平台。该框架具有可扩展性，允许通过容器化或直接连接集成多样化的智能体。未来发展包括实现大规模并行评估以及纳入既有基准。该项目鼓励开源贡献，以扩展任务并协作完善框架。

总结

这些强大的 AI 命令行智能体的出现标志着软件开发的根本转变，使终端成为一个动态且协作的环境。正如我们所见，没有单一的“最佳”工具；相反，一个充满活力的生态正在形成，每个智能体都提供其专长。理想选择完全取决于开发者的需求：Claude 适合复杂的架构任务，Gemini 适合多才多艺的多模态问题求解，Aider 擅长以 git 为中心的直接代码编辑，GitHub Copilot 则在 GitHub 工作流中无缝集成。随着这些工具的不断演进，熟练运用它们将成为一项必备技能，从根本上改变开发者构建、调试和管理软件的方式。

参考资料

Anthropic. Claude. docs.anthropic.com/en/docs/cla…
Google Gemini Cli github.com/google-gemi…
Aider. aider.chat/
GitHub Copilot CLI docs.github.com/en/copilot/…
Terminal Bench: www.tbench.ai/