Claude 节省Token 小技巧了解一下Claude的模型以及消耗模型性能与特点典型场景 Opus 最高智能，

了解一下Claude的模型以及消耗

我刚开始在终端使用时默认就是Opus，我也没设置啊，所以刚开始的时候还没用一会就限制了

Claude 会在上下文剩余20%时自动压缩，但那时基本为时已晚。要养成手动提前使用 /compact 命令 的好习惯。

不同的独立任务多开几个 终端窗口。任务一旦完成，立刻关闭窗口 (/clear 也行)。保持任务的原子性，防止不相关的上下文污染后续对话。

Claude为了“记住”历史，会在每次请求时重新加载全部对话和文件内容 。对话越长，这个“雪球”就滚得越大，成本呈指数级增长。

日常开发坚决使用 Sonnet。只有遇到非常复杂的任务时，才使用 Opus 模型

可以通过 /model sonnet的命令切换当前使用的模型。

或者使用Option + P 快捷方式

使用iTerm2终端的同学，需要在设置里修改option功能

安装npx ccusage@latest工具，实时使用量跟踪，带有消耗率预测。

不要反复纠正它：你刚才错了，试试这个”，而是应该直接编辑原始提示，避免记住所有历史错误。

不要随意对话。先让 Claude Code 生成一个任务清单（TODO List） 。然后你再引导它逐一完成。这种“先规划，后执行”的模式，能让每一次交互都更精准。

运行 /memory 命令可以查看和编辑 Claude “记住”了哪些核心信息。对于版本号、关键工具链等固定内容，在这里一次性修正，就不用在对话中反复纠错了。

让其他工具干脏活累活，比如，当你要写一段文档，或者审查一段代码，可以先让其他免费的AI帮你生成一个完美的提示词，或者写一个完美的命令。然后投递给Claude

在项目配置或初始提示中，用规则强制约束 Claude 的行为 。例如：

不要给 Claude 整个文件，只给它预期会更改的代码，外加周边 20-40 行的相关上下文 。多用总结替代长篇大论的文档。传递文件路径而非原始内容，让模型按需请求。这样做，同样任务的 Token 消耗能减少很多

原因：Sub-Agent上下文隔离，避免无关信息干扰，减少token消耗