模型选择完整参考模型选择完整参考可用模型对比模型模型 ID 上下文窗口特点适用场景 Claude Opus 4

模型选择完整参考

可用模型对比

模型	模型 ID	上下文窗口	特点	适用场景
Claude Opus 4.6	`claude-opus-4-6`	200K tokens	最强推理，最慢，最贵	复杂编码、架构设计、深度分析
Claude Opus 4.6 (1M)	`claude-opus-4-6[1m]`	1M tokens	超长上下文，适合分析超大代码库	全仓库级分析、超长文档
Claude Sonnet 4.6	`claude-sonnet-4-6`	200K tokens	均衡，速度和质量兼顾	日常开发、代码审查、文档
Claude Haiku 4.5	`claude-haiku-4-5-20251001`	200K tokens	最快，最省，质量略低	简单任务、格式转换、快速问答

当前最新版本（2026年3月）：Opus 4.6 / Sonnet 4.6 / Haiku 4.5

关于 1M 上下文：claude-opus-4-6[1m] 支持最高 100 万 token 的上下文，可以一次性分析整个大型代码仓库。适合超大型项目的全局分析，但成本显著高于标准版。

模型 ID 命名规则

claude - opus - 4 - 6
  ↑        ↑    ↑   ↑
厂商    能力级别 代  版
                     本本次
                     主修
                     版

示例：

claude-opus-4-6 → Claude，Opus 级别，第 4 代，第 6 次更新
claude-haiku-4-5-20251001 → Haiku，带日期后缀表示具体快照版本

选择策略

按任务类型选择

Opus 4.6（高质量，高成本）：
✓ 复杂的业务逻辑代码编写
✓ 多文件涉及架构设计的改动
✓ 深度 bug 根因分析
✓ 安全审查和风险评估
✓ 需要长上下文理解的任务（>50K tokens）

Sonnet 4.6（均衡，推荐日常）：
✓ 普通功能开发
✓ 代码审查
✓ 文档写作
✓ 测试代码生成
✓ API 接口理解

Haiku 4.5（快速，省 Token）：
✓ 搜索和定位代码
✓ 生成 commit message
✓ 格式转换、批量重命名
✓ 简单的翻译和摘要
✓ 作为子 Agent 做探索性工作

省 Token 的模型分工策略

主会话（Opus）                 子 Agent（Sonnet/Haiku）
─────────────────────          ────────────────────────
方案设计                  ←    代码库探索（读 3+ 文件）
核心代码编写              ←    查询文档/知识库
复杂 bug 分析             ←    生成 commit message
架构决策                  ←    批量搜索（Grep）
安全审查                  ←    格式转换

如何切换模型

方式一：会话中切换（临时）

/model                         # 查看当前模型
/model claude-opus-4-6         # 切换到 Opus
/model claude-sonnet-4-6       # 切换到 Sonnet
/model claude-haiku-4-5-20251001  # 切换到 Haiku

方式二：配置文件（持久）

// ~/.claude/settings.json
{
  "model": "claude-opus-4-6"
}

方式三：启动时指定

claude --model claude-sonnet-4-6

快速模式（/fast）

/fast 不是切换到不同模型，而是让同一模型以更快的输出速度响应（可能略微影响格式）：

/fast       # 开启快速模式
/fast off   # 关闭快速模式

适合场景：需要快速看到结果，对格式美观度要求不高时。

Token 计费说明

Token 是 API 计费的基本单位，约等于：

英文：1 个单词 ≈ 1-1.5 tokens
中文：1 个汉字 ≈ 1-2 tokens
代码：1 行 ≈ 5-15 tokens

每次对话的 Token 构成：

输入 Token（你付费）：
├── CLAUDE.md 内容（每轮都有，固定成本）
├── 对话历史（随轮数增长）
├── 当前消息
└── 工具调用结果（Read/Grep 的输出）

输出 Token（你也付费）：
├── Claude 的回答文字
└── 工具调用请求（Bash 命令等）

关键结论：对话越长，每一轮的 Token 消耗越大，因为历史一直在累积。这就是为什么要定期 /compact。

上下文窗口 200K 是什么概念？

200,000 tokens ≈

代码文件：约 400 个 200 行的 TypeScript 文件
对话历史：约 500-1000 轮对话
英文文档：约 150,000 个单词（300 页书）
中文文档：约 100,000 个汉字（200 页书）

在实际使用中，Claude Code 通常在 20K-50K tokens 的范围内工作效果最好。超过 100K 时，早期内容的注意力会下降（"Lost in the Middle"现象），建议使用 /compact 管理。

常见问题

Q：专家建议用 Opus 做主会话，但我没有预算，怎么办？

Sonnet 在大多数日常编码任务中表现已经很好，差距主要体现在：

复杂的多步推理（如跨 10+ 文件的架构分析）
边界情况的代码安全性判断

如果预算有限，可以这样分配：

日常开发 → Sonnet
关键的架构决策/安全审查 → Opus（临时切换）

Q：子 Agent 推荐用 Sonnet，但我的 settings.json 设置了 Opus，会怎样？

子 Agent 默认继承主会话的模型设置。CLAUDE.md 中的"模型分工策略"是指导 Claude 在内部委派时使用不同模型的指令，Claude 会根据任务类型自动选择。如果明确指定，以明确指定为准。

Q：Claude.ai Pro 订阅和 API Key 用 Claude Code 有什么区别？

	Claude.ai Pro/Team 订阅	API Key
认证方式	`claude login`（OAuth）	`ANTHROPIC_API_KEY` 环境变量
计费方式	月费订阅，有使用量上限	按 token 计费，无上限
模型访问	受订阅计划限制	可访问所有模型
适合场景	个人日常开发	企业/批量/自动化

两种方式都能正常使用 Claude Code 的所有功能，选择哪种取决于你的使用量和付费方式偏好。