模型选择完整参考
可用模型对比
| 模型 | 模型 ID | 上下文窗口 | 特点 | 适用场景 |
|---|---|---|---|---|
| Claude Opus 4.6 | claude-opus-4-6 | 200K tokens | 最强推理,最慢,最贵 | 复杂编码、架构设计、深度分析 |
| Claude Opus 4.6 (1M) | claude-opus-4-6[1m] | 1M tokens | 超长上下文,适合分析超大代码库 | 全仓库级分析、超长文档 |
| Claude Sonnet 4.6 | claude-sonnet-4-6 | 200K tokens | 均衡,速度和质量兼顾 | 日常开发、代码审查、文档 |
| Claude Haiku 4.5 | claude-haiku-4-5-20251001 | 200K tokens | 最快,最省,质量略低 | 简单任务、格式转换、快速问答 |
当前最新版本(2026年3月):Opus 4.6 / Sonnet 4.6 / Haiku 4.5
关于 1M 上下文:claude-opus-4-6[1m] 支持最高 100 万 token 的上下文,可以一次性分析整个大型代码仓库。适合超大型项目的全局分析,但成本显著高于标准版。
模型 ID 命名规则
claude - opus - 4 - 6
↑ ↑ ↑ ↑
厂商 能力级别 代 版
本本次
主修
版
示例:
claude-opus-4-6→ Claude,Opus 级别,第 4 代,第 6 次更新claude-haiku-4-5-20251001→ Haiku,带日期后缀表示具体快照版本
选择策略
按任务类型选择
Opus 4.6(高质量,高成本):
✓ 复杂的业务逻辑代码编写
✓ 多文件涉及架构设计的改动
✓ 深度 bug 根因分析
✓ 安全审查和风险评估
✓ 需要长上下文理解的任务(>50K tokens)
Sonnet 4.6(均衡,推荐日常):
✓ 普通功能开发
✓ 代码审查
✓ 文档写作
✓ 测试代码生成
✓ API 接口理解
Haiku 4.5(快速,省 Token):
✓ 搜索和定位代码
✓ 生成 commit message
✓ 格式转换、批量重命名
✓ 简单的翻译和摘要
✓ 作为子 Agent 做探索性工作
省 Token 的模型分工策略
主会话(Opus) 子 Agent(Sonnet/Haiku)
───────────────────── ────────────────────────
方案设计 ← 代码库探索(读 3+ 文件)
核心代码编写 ← 查询文档/知识库
复杂 bug 分析 ← 生成 commit message
架构决策 ← 批量搜索(Grep)
安全审查 ← 格式转换
如何切换模型
方式一:会话中切换(临时)
/model # 查看当前模型
/model claude-opus-4-6 # 切换到 Opus
/model claude-sonnet-4-6 # 切换到 Sonnet
/model claude-haiku-4-5-20251001 # 切换到 Haiku
方式二:配置文件(持久)
// ~/.claude/settings.json
{
"model": "claude-opus-4-6"
}
方式三:启动时指定
claude --model claude-sonnet-4-6
快速模式(/fast)
/fast 不是切换到不同模型,而是让同一模型以更快的输出速度响应(可能略微影响格式):
/fast # 开启快速模式
/fast off # 关闭快速模式
适合场景:需要快速看到结果,对格式美观度要求不高时。
Token 计费说明
Token 是 API 计费的基本单位,约等于:
- 英文:1 个单词 ≈ 1-1.5 tokens
- 中文:1 个汉字 ≈ 1-2 tokens
- 代码:1 行 ≈ 5-15 tokens
每次对话的 Token 构成:
输入 Token(你付费):
├── CLAUDE.md 内容(每轮都有,固定成本)
├── 对话历史(随轮数增长)
├── 当前消息
└── 工具调用结果(Read/Grep 的输出)
输出 Token(你也付费):
├── Claude 的回答文字
└── 工具调用请求(Bash 命令等)
关键结论:对话越长,每一轮的 Token 消耗越大,因为历史一直在累积。这就是为什么要定期 /compact。
上下文窗口 200K 是什么概念?
200,000 tokens ≈
代码文件:约 400 个 200 行的 TypeScript 文件
对话历史:约 500-1000 轮对话
英文文档:约 150,000 个单词(300 页书)
中文文档:约 100,000 个汉字(200 页书)
在实际使用中,Claude Code 通常在 20K-50K tokens 的范围内工作效果最好。超过 100K 时,早期内容的注意力会下降("Lost in the Middle"现象),建议使用 /compact 管理。
常见问题
Q:专家建议用 Opus 做主会话,但我没有预算,怎么办?
Sonnet 在大多数日常编码任务中表现已经很好,差距主要体现在:
- 复杂的多步推理(如跨 10+ 文件的架构分析)
- 边界情况的代码安全性判断
如果预算有限,可以这样分配:
- 日常开发 → Sonnet
- 关键的架构决策/安全审查 → Opus(临时切换)
Q:子 Agent 推荐用 Sonnet,但我的 settings.json 设置了 Opus,会怎样?
子 Agent 默认继承主会话的模型设置。CLAUDE.md 中的"模型分工策略"是指导 Claude 在内部委派时使用不同模型的指令,Claude 会根据任务类型自动选择。如果明确指定,以明确指定为准。
Q:Claude.ai Pro 订阅和 API Key 用 Claude Code 有什么区别?
| Claude.ai Pro/Team 订阅 | API Key | |
|---|---|---|
| 认证方式 | claude login(OAuth) | ANTHROPIC_API_KEY 环境变量 |
| 计费方式 | 月费订阅,有使用量上限 | 按 token 计费,无上限 |
| 模型访问 | 受订阅计划限制 | 可访问所有模型 |
| 适合场景 | 个人日常开发 | 企业/批量/自动化 |
两种方式都能正常使用 Claude Code 的所有功能,选择哪种取决于你的使用量和付费方式偏好。