模型选择完整参考

3 阅读4分钟

模型选择完整参考


可用模型对比

模型模型 ID上下文窗口特点适用场景
Claude Opus 4.6claude-opus-4-6200K tokens最强推理,最慢,最贵复杂编码、架构设计、深度分析
Claude Opus 4.6 (1M)claude-opus-4-6[1m]1M tokens超长上下文,适合分析超大代码库全仓库级分析、超长文档
Claude Sonnet 4.6claude-sonnet-4-6200K tokens均衡,速度和质量兼顾日常开发、代码审查、文档
Claude Haiku 4.5claude-haiku-4-5-20251001200K tokens最快,最省,质量略低简单任务、格式转换、快速问答

当前最新版本(2026年3月):Opus 4.6 / Sonnet 4.6 / Haiku 4.5

关于 1M 上下文claude-opus-4-6[1m] 支持最高 100 万 token 的上下文,可以一次性分析整个大型代码仓库。适合超大型项目的全局分析,但成本显著高于标准版。


模型 ID 命名规则

claude - opus - 4 - 6
  ↑        ↑    ↑   ↑
厂商    能力级别 代  版
                     本本次
                     主修
                     版

示例:

  • claude-opus-4-6 → Claude,Opus 级别,第 4 代,第 6 次更新
  • claude-haiku-4-5-20251001 → Haiku,带日期后缀表示具体快照版本

选择策略

按任务类型选择

Opus 4.6(高质量,高成本):
✓ 复杂的业务逻辑代码编写
✓ 多文件涉及架构设计的改动
✓ 深度 bug 根因分析
✓ 安全审查和风险评估
✓ 需要长上下文理解的任务(>50K tokens)

Sonnet 4.6(均衡,推荐日常):
✓ 普通功能开发
✓ 代码审查
✓ 文档写作
✓ 测试代码生成
✓ API 接口理解

Haiku 4.5(快速,省 Token):
✓ 搜索和定位代码
✓ 生成 commit message
✓ 格式转换、批量重命名
✓ 简单的翻译和摘要
✓ 作为子 Agent 做探索性工作

省 Token 的模型分工策略

主会话(Opus)                 子 Agent(Sonnet/Haiku)
─────────────────────          ────────────────────────
方案设计                  ←    代码库探索(读 3+ 文件)
核心代码编写              ←    查询文档/知识库
复杂 bug 分析             ←    生成 commit message
架构决策                  ←    批量搜索(Grep)
安全审查                  ←    格式转换

如何切换模型

方式一:会话中切换(临时)

/model                         # 查看当前模型
/model claude-opus-4-6         # 切换到 Opus
/model claude-sonnet-4-6       # 切换到 Sonnet
/model claude-haiku-4-5-20251001  # 切换到 Haiku

方式二:配置文件(持久)

// ~/.claude/settings.json
{
  "model": "claude-opus-4-6"
}

方式三:启动时指定

claude --model claude-sonnet-4-6

快速模式(/fast)

/fast 不是切换到不同模型,而是让同一模型以更快的输出速度响应(可能略微影响格式):

/fast       # 开启快速模式
/fast off   # 关闭快速模式

适合场景:需要快速看到结果,对格式美观度要求不高时。


Token 计费说明

Token 是 API 计费的基本单位,约等于:

  • 英文:1 个单词 ≈ 1-1.5 tokens
  • 中文:1 个汉字 ≈ 1-2 tokens
  • 代码:1 行 ≈ 5-15 tokens

每次对话的 Token 构成

输入 Token(你付费):
├── CLAUDE.md 内容(每轮都有,固定成本)
├── 对话历史(随轮数增长)
├── 当前消息
└── 工具调用结果(Read/Grep 的输出)

输出 Token(你也付费):
├── Claude 的回答文字
└── 工具调用请求(Bash 命令等)

关键结论:对话越长,每一轮的 Token 消耗越大,因为历史一直在累积。这就是为什么要定期 /compact


上下文窗口 200K 是什么概念?

200,000 tokens ≈

代码文件:约 400 个 200 行的 TypeScript 文件
对话历史:约 500-1000 轮对话
英文文档:约 150,000 个单词(300 页书)
中文文档:约 100,000 个汉字(200 页书)

在实际使用中,Claude Code 通常在 20K-50K tokens 的范围内工作效果最好。超过 100K 时,早期内容的注意力会下降("Lost in the Middle"现象),建议使用 /compact 管理。


常见问题

Q:专家建议用 Opus 做主会话,但我没有预算,怎么办?

Sonnet 在大多数日常编码任务中表现已经很好,差距主要体现在:

  • 复杂的多步推理(如跨 10+ 文件的架构分析)
  • 边界情况的代码安全性判断

如果预算有限,可以这样分配:

  • 日常开发 → Sonnet
  • 关键的架构决策/安全审查 → Opus(临时切换)

Q:子 Agent 推荐用 Sonnet,但我的 settings.json 设置了 Opus,会怎样?

子 Agent 默认继承主会话的模型设置。CLAUDE.md 中的"模型分工策略"是指导 Claude 在内部委派时使用不同模型的指令,Claude 会根据任务类型自动选择。如果明确指定,以明确指定为准。

Q:Claude.ai Pro 订阅和 API Key 用 Claude Code 有什么区别?

Claude.ai Pro/Team 订阅API Key
认证方式claude login(OAuth)ANTHROPIC_API_KEY 环境变量
计费方式月费订阅,有使用量上限按 token 计费,无上限
模型访问受订阅计划限制可访问所有模型
适合场景个人日常开发企业/批量/自动化

两种方式都能正常使用 Claude Code 的所有功能,选择哪种取决于你的使用量和付费方式偏好。