1. Anthropic 与 Claude
Anthropic 由前 OpenAI 研究副总裁 Dario Amodei 和姐姐 Daniela Amodei 于 2021 年联合创立。这家公司从第一天起就把"安全"二字刻进了 DNA——他们提出的 Constitutional AI(宪法式 AI)训练方法,核心思路是让模型在训练阶段就通过一组明确的准则来自我约束,而不是纯靠人类标注员手动纠偏。
这种路线反映在产品上,就是 Claude 在拒绝有害请求时往往更坚决,同时在长文本理解、代码生成和复杂推理方面持续加码。如果说 OpenAI 是"先跑马圈地再治理",Anthropic 更像是"边建边规范"。
Claude vs ChatGPT vs Gemini
三家的模型各有侧重,简单拉一下对比:
| 维度 | Claude (Anthropic) | ChatGPT (OpenAI) | Gemini (Google) |
|---|---|---|---|
| 核心卖点 | 安全性 + 超长上下文 + 代码能力 | 生态最全、用户基数最大 | 多模态原生、与 Google 生态深度整合 |
| 最大上下文 | 1M tokens | 128k tokens (GPT-4o) | 1M~2M tokens |
| 代码能力 | Opus 系列在编码基准上领先 | o3/o4-mini 推理强 | 代码能力快速追赶 |
| API 生态 | 相对精简,但质量高 | 最成熟、第三方工具最多 | 依托 GCP,企业级集成强 |
| CLI 开发工具 | Claude Code(本系列主角) | Codex CLI | 无独立 CLI 工具 |
一句话总结:如果你做的事情涉及大量代码、长上下文分析、或者需要 AI 在终端里直接帮你干活,Claude 目前是最值得投入精力学习的选项。
2. 模型家族全景
Claude 的模型命名遵循一个简单规则:产品线名 + 版本号。产品线有三条,定位很清晰:
-
Opus — 旗舰级。最强推理能力和复杂编码能力,适合高难度任务。就像军队里的特种兵,贵但能解决硬问题。
-
Sonnet — 均衡型。速度和智能的最佳平衡点,日常开发的主力选手。性价比之王,大多数场景用它就够了。
-
Haiku — 轻量级。响应速度最快,智能水平接近前沿。适合需要低延迟、高吞吐的场景,比如实时分类、自动补全。
当前主力模型参数对比
| 参数 | Opus 4.7 | Sonnet 4.6 | Haiku 4.5 |
|---|---|---|---|
| 上下文窗口 | 1M tokens | 1M tokens | 200k tokens |
| 最大输出 | 128k tokens | 64k tokens | 64k tokens |
| 输入定价 | $5 / 百万 tokens | $3 / 百万 tokens | $1 / 百万 tokens |
| 输出定价 | $25 / 百万 tokens | $15 / 百万 tokens | $5 / 百万 tokens |
| 知识截止 | 2026 年 1 月 | 2025 年 8 月 | 2025 年 2 月 |
| 思考模式 | 自适应思考 | 扩展思考 | 标准 |
| 典型用途 | 复杂架构设计、高难度调试、研究 | 日常编码、代码审查、文档生成 | 实时分类、自动补全、批量处理 |
几个关键数字值得记住:
-
Opus 4.7 的 1M 上下文 + 128k 输出,意味着你可以把一整个中型项目的代码库丢给它分析,然后让它输出一份完整的重构方案。
-
Sonnet 4.6 是 Claude Code 的默认模型,日常使用中你接触最多的就是它。
-
Haiku 4.5 虽然是"入门级",但它的能力已经超过了一年前的 Sonnet 4.0。模型迭代速度很快,低端型号的天花板一直在涨。
旧版模型谱系与弃用时间线
模型更新换代很快,旧版本会逐步退役。以下是当前的弃用状态:
| 模型 | 状态 | 退役时间 |
|---|---|---|
| Opus 4.6 | 当前可用 | — |
| Opus 4.5 | 当前可用 | — |
| Opus 4.1 | 当前可用 | — |
| Opus 4.0 | 当前可用 | — |
| Sonnet 4.5 | 已弃用 | 2026-06-15 退役 |
| Sonnet 4.0 | 已弃用 | 2026-06-15 退役 |
| Haiku 3.5 | 当前可用 | — |
| Haiku 3.0 | 当前可用 | — |
| Opus 3.0 | 已弃用 | — |
如果你的项目还在用 Sonnet 4.5 或 Sonnet 4.0,现在就该规划迁移了。2026 年 6 月 15 日之后这两个模型会彻底下线,API 调用会返回错误。
特殊模型:Mythos Preview
Anthropic 还有一个比较特殊的模型叫 Mythos Preview,专门面向防御性网络安全研究。这个模型目前是邀请制,不对公众开放。如果你在安全研究领域工作,可以通过 Anthropic 官方渠道申请访问。普通开发者不用关心这个。
3. 产品形态矩阵
Claude 不只是一个聊天机器人。Anthropic 围绕 Claude 模型构建了一整套产品矩阵,覆盖从普通用户到企业级部署的各种场景。
claude.ai — 对话界面
最基础的使用方式。打开浏览器,输入 claude.ai,注册账号就能用。支持文本对话、文件上传、图片理解。免费版有使用量限制,Pro 订阅 $20/月,Team 和 Enterprise 有更高的配额和管理功能。
适合人群:想快速体验 Claude 能力的普通用户、偶尔用 AI 辅助写作或分析的非技术人员。
Claude API — 开发者接口
通过 HTTP API 调用 Claude 模型,是所有集成开发的基础。支持文本生成、工具调用(Tool Use)、视觉理解、流式输出等能力。
文档地址:platform.claude.com/docs/
适合人群:需要在自己的应用中集成 AI 能力的开发者。
Claude Code — CLI 开发工具
这是本系列的主角。Claude Code 是一个基于命令行的 AI 编程助手,直接在你的终端里运行。它能读取你的项目文件、执行命令、修改代码、运行测试,像一个坐在你旁边的高级工程师。
与传统的 IDE 插件不同,Claude Code 工作在终端层面,不绑定任何特定编辑器。你用 VS Code 也好、Vim 也好、甚至纯命令行也好,Claude Code 都能无缝配合。
适合人群:日常在终端工作的开发者,尤其是后端、DevOps、全栈工程师。
Claude Managed Agents — 托管智能体平台
这是 Anthropic 推出的云端长任务执行平台。你可以把一个复杂任务(比如"分析这个仓库的所有 PR 并生成周报")交给一个托管智能体,它会在云端独立完成,完成后通知你。
与 Claude Code 的区别:Claude Code 是交互式的,你在终端里跟它对话;Managed Agents 是异步的,你提交任务后可以去忙别的。
适合人群:需要 AI 执行长时间运行任务的团队。
第三方云平台
Claude 模型还可以通过以下云平台访问:
-
AWS Bedrock — 在 AWS 生态内调用 Claude,享受 AWS 的安全合规和计费体系。
-
Google Cloud Vertex AI — 在 GCP 内调用 Claude,适合已经深度绑定 Google Cloud 的团队。
-
Azure AI — 微软 Azure 平台上的 Claude 接入点。
这些第三方平台的定价和配额可能与 Anthropic 官方 API 有所不同,但模型能力是一样的。选择哪个平台取决于你现有的云基础设施。
4. Claude Code 在生态中的位置
Claude Code 是什么
一句话:Claude Code 是一个在终端里运行的 AI 编程助手,它能理解你的整个项目、执行多步骤操作、并且可以通过 Skills、Hooks、MCP 等机制无限扩展。
你可以把它理解为一个"懂代码的 AI 同事",它不只是给你补全几行代码,而是能帮你做完整的工程任务:分析 bug 的根因、重构一个模块、写测试、审查 PR、生成文档。
与 Cursor / GitHub Copilot 的区别
市面上 AI 编码工具很多,Claude Code 的差异化在哪里?
| 维度 | Claude Code | Cursor | GitHub Copilot |
|---|---|---|---|
| 运行方式 | CLI 终端 | IDE(VS Code fork) | IDE 插件 |
| 项目理解 | 深度理解整个代码库 | 理解当前文件和上下文 | 主要基于当前文件 |
| 操作能力 | 读写文件、执行命令、Git 操作 | 编辑当前文件 | 代码补全和聊天 |
| 可扩展性 | Skills / Hooks / MCP / 子代理 | 有限的插件系统 | 扩展能力有限 |
| 编辑器绑定 | 不绑定,纯终端 | 绑定 Cursor 编辑器 | 绑定 VS Code / JetBrains |
| 自动化能力 | 支持 headless 模式和 CI 集成 | 不支持 | 不支持 |
简单说,Copilot 是"代码补全工具",Cursor 是"AI 增强 IDE",Claude Code 是"AI 工程师"。三者不是互斥关系——你完全可以在 VS Code 里装着 Copilot 的同时,在终端里跑 Claude Code。
核心优势
-
深度项目理解:Claude Code 启动时会自动读取项目的 CLAUDE.md 配置文件、理解项目结构、识别技术栈。它不是无脑对每个问题从零开始,而是带着对项目的持续理解来工作。
-
多工具编排:它能在一次对话中读取文件、分析代码、修改多个文件、运行测试、查看结果、再修复问题。整个流程是连贯的,不需要你手动复制粘贴中间结果。
-
可扩展架构:通过 Skills 系统你可以教它新技能,通过 Hooks 系统你可以在特定事件时触发自动化操作,通过 MCP 协议你可以让它连接外部服务(数据库、API、文件系统等)。
适用场景
-
日常编码:写新功能、修 bug、写测试
-
代码审查:分析 PR 变更、发现潜在问题
-
重构:大规模代码结构调整
-
调试:根据错误日志追踪根因
-
文档生成:根据代码自动生成 API 文档或技术笔记
-
DevOps:编写部署脚本、排查环境问题
5. 定价体系速览
Claude 的定价按 token 计费,分输入和输出两个价格。理解定价逻辑能帮你在实际使用中有效控制成本。
按模型分层定价
定价逻辑很直观:模型越强,价格越高。输出 token 比输入 token 贵 5 倍,因为输出需要更多计算。
| 模型 | 输入价格 | 输出价格 | 缓存写入 | 缓存读取 |
|---|---|---|---|---|
| Opus 4.7 | $5 / MTok | $25 / MTok | $6.25 / MTok | $0.50 / MTok |
| Sonnet 4.6 | $3 / MTok | $15 / MTok | $3.75 / MTok | $0.30 / MTok |
| Haiku 4.5 | $1 / MTok | $5 / MTok | $1.25 / MTok | $0.10 / MTok |
MTok = 百万 tokens
给个直觉:用 Sonnet 4.6 写一个中等复杂度的功能(大约 2000 tokens 输入 + 1000 tokens 输出),成本大约是 ,也就是不到分钱。日常开发场景下,一天的费用很难超过5。
降本三板斧
如果你的用量比较大,有三个策略可以显著降低成本:
1. Prompt Caching — 重复内容只算一次
开启 Prompt Caching 后,对话中重复出现的前缀内容(比如系统提示词、项目背景信息)会被缓存。缓存命中时,读取价格只有原始输入价格的约 0.1 倍。
举个例子:你的系统提示词有 5000 tokens,每次请求都要发送。没有缓存时,用 Sonnet 4.6 每次要花 在这部分输入上。开启缓存后,第二次开始只需0.0015——直接省了 90%。
2. Batch API — 不着急的任务打五折
如果你的任务不需要实时返回(比如批量代码分析、文档翻译),可以用 Batch API 提交。批处理模式下,价格直接打 50% 折扣,代价是结果可能需要等几分钟到几小时。
3. 选对模型 — 别用大炮打蚊子
不是每个任务都需要 Opus。大量日常编码任务用 Sonnet 就够了,简单的分类和格式化任务用 Haiku 更划算。合理选择模型,成本可以差 5 倍以上。
一个实用策略:先用 Haiku 快速验证思路,确认方向对了再用 Sonnet 精修,只在真正需要深度推理时才上 Opus。