〇、概述
AI编程(Vibe Coding)越来越普及,Cursor作为最流行的AI编程工具之一,已经成为很多开发者的日常。但在实际使用中,我们总会遇到一些困惑:模型选择、Token消耗、新功能理解...这些问题直接影响使用体验和成本。
Vibe Coding 已逐渐成为开发者日常工作的重要组成部分,但在实际应用中,模型选择、Token 消耗控制、新功能理解等问题,往往影响开发效率与使用成本。
这份文档基于实际使用经验,总结了三个我开发中遇到的问题:
-
第一次打开 Cursor,满屏的模型选项,到底该选哪个?
-
用了一段时间,发现token的额度都不够用, 我应该怎么做才能节省Token?
-
AI 圈天天出新名词,突然冒出来个 Agent Skills,这是啥, 有啥用
一、我应该使用哪个模型?
模型选择需围绕性能(SWE-bench 评分)、价格和适用场景三各维度,结合性价比优先级进行决策。以下是我总结四类场景的推荐方案:
评分参考SWE-bench排行榜:www.swebench.com/
SWE-bench的评分依据是提交的代码修复能否让所有相关的测试用例通过。
1. 🚀 顶级编程能力(各家旗舰)
这类模型代表了各家厂商的最强实力。SWE-bench 评分仅供参考,不同模型有不同的"性格"(如 Claude 擅长长文本和代码风格,GPT 擅长逻辑推理,Gemini 擅长多模态和速度)。
整理时间: 2026年1月, 参考当前的SWE-bench评分, cursor官网的定价
| 模型 | 厂商 | 价格 (输入/输出) | 特点与适用场景 |
|---|---|---|---|
| Claude 4.5 Opus | Anthropic | 25 | 编码天花板。SWE-bench 评分第一 (74.4%)。代码风格优雅,逻辑缜密,极少出错。但价格极贵,适合对代码质量有极致要求且预算充足的项目。 |
| Gemini 3 Pro | 12 | 综合最强。SWE-bench 评分极高 (74.2%),且价格仅为 Opus 的一半。响应速度快,多模态理解能力强,适合大多数高难度任务。 | |
| GPT-5.2 | OpenAI | 14 | 推理专家。逻辑推理能力极强 (71.8%),在复杂算法实现和 Bug 追踪上表现出色。Cursor 对 GPT 系列的适配通常最好(System Prompt 优化)。 |
2. ⚖️ 日常够用,性价比(主力模型)
兼顾性能与成本,适合 80% 的日常开发(CRUD、重构、写测试)。建议根据个人喜好选择。
| 模型 | 厂商 | 价格 (输入/输出) | 特点 |
|---|---|---|---|
| GPT-5.1 Codex | OpenAI | 10 | 编码专项优化。去除了通用对话的冗余能力,专注于代码生成,价格亲民,响应迅速。 |
| Claude 4.5 Sonnet | Anthropic | 15 | 均衡之选。比 Opus 便宜,但保留了 Claude 系列优秀的代码理解和长文本能力。适合喜欢 Anthropic 生态的开发者。 |
| Gemini 3 Flash | 3 | 速度与成本。比 Pro 版本便宜很多,但比 2.5 Flash 更聪明。适合需要快速迭代的开发场景。 |
3. 💰 低成本适合大量Token场景
适合处理超长文档、全局搜索分析、日志分析或生成简单脚本。
| 模型 | 厂商 | 价格 (输入/输出) | 特点 |
|---|---|---|---|
| Gemini 2.5 Flash | 2.50 | 超长上下文。支持百万级 Token,极其便宜,适合把整个文档扔进去让它总结或翻译。 | |
| GPT-5 Mini | OpenAI | 2 | OpenAI 轻量版。适合简单的指令执行和格式化任务。 |
| Claude 4.5 Haiku | Anthropic | 5 | 最强轻量级。虽然比上面两个贵,但在轻量级模型中智商最高,适合简单的逻辑处理。 |
| Grok Code | xAI | 1.50 | 价格地板。适合基础的语法纠错。 |
4. 🚫 性价比极低,尽量避免使用
这些模型要么价格虚高,要么是旧版本,已被新模型全面超越。
| 模型 | 避坑理由 |
|---|---|
| GPT-5 Fast | 价格 (20) 甚至比性能更强的 GPT-5.2 和 Gemini 3 Pro 还贵,完全没必要使用。 |
| Claude 4 Sonnet | 旧版本。价格 (15) 和新版 4.5 Sonnet 一样,但能力弱很多。务必选择带 "4.5" 的版本。 |
| Claude 4 Sonnet 1M | 旧版本大窗口版。价格翻倍 (22.5),完全可以用 Gemini 2.5 Flash 替代,后者更便宜且上下文更长。 |
二、怎样可以节省Token?
Token 消耗直接关联使用成本,其核心消耗原因在于上下文累积与不合理的使用习惯。通过科学的使用方法,可有效降低 Token 消耗,提升使用效率。
什么会导致Token消耗越来越大?
上下文累积:
每次对话会保留完整上下文,包括用户消息、AI 回复、引用的代码 / 文档, 配置的rules, 加载的mcp, 等等,且每次交互都会重新传递这些内容, 多轮迭代对话会进一步拉长上下文,持续增加 Token 消耗。
高消耗场景示例:
- 长时间单窗口对话(10 轮以上):上下文呈指数级增长;
- 大文件无差别引用:直接引用数千行配置文件、日志文件,一次性消耗大量 Token;
- 多主题混合对话:同一窗口中讨论不相关话题,导致上下文冗余杂乱;
1. 精准定位需求与代码
描述具体问题,避免让 AI 猜测:
❌ 不推荐: "帮我看看这个文件有什么问题"
✅ 推荐: "@src/components/UserForm.vue 第45行的handleSubmit函数中,表单验证逻辑有问题"
合理引用,避免让 AI 自行检索:
❌ 不推荐: "参考用户卡片组件的样式改一下"(还需要 AI 去找用户卡片)
✅ 推荐: "请参照 @/components/UserCard.tsx 的卡片样式,为当前组件添加阴影效果和圆角"
实用技巧:
- 利用
@文件名精准指定文件,#函数名定位特定函数/类 - 直接选中代码片段,Cursor 会自动完成引用
- 清晰描述问题现象、预期结果,提供完整上下文信息
2. 使用Plan模式
对于复杂任务,使用 Plan 模式可以:
- 先让 AI 提出澄清问题
- 分析代码库获取相关上下文
- 创建完整实现计划, 审阅并编辑计划
- 确认后再执行
该模式可减少多轮反复沟通,集中处理核心需求,显著降低 Token 消耗。
3. 优化上下文管理
规则固化:
将重复使用的提示、项目规范写入 .cursor/rules 文件,避免重复说明。
Rules 最佳实践:
- 篇幅控制在 500 行以内,避免信息过载
- 提供具体示例,增强可操作性
- 聚焦明确的规则点,避免模糊表述
- 覆盖编码风格、命名规范、架构约束等核心场景
主题聚焦: 同一对话窗口仅处理一个功能模块或一类问题,高度相关任务可合并。及时开启新对话,避免冗余累积。
上下文压缩: 如果对话已经很长,但确实需要继续提问,可以使用:
- 内置功能:使用 Cursor 的 "/Summarize" 命令,自动提取对话关键信息,剔除冗余内容
- 手动操作:定期让 AI 生成对话摘要,以摘要作为后续对话的基础上下文
4. 其他技巧
善用代码补全,不必事事询问 AI:
- 对于极其简单的修改(如更改文字、调整间距、修改颜色值),直接定位到代码位置手动修改即可
- 一旦改过一处,AI 的补全机制往往能自动帮你完成其他相似位置的修改
- 对于小的、局部的改动,可以用"先写注释,再让 AI 补全"的方式来实现
- 大部分 AI 工具的自动补全不占用对话额度
合理使用免费 AI 工具: 对于通用性问题(如某个 API 怎么用、实现某个功能有哪些方案),可以使用免费的 AI 工具(如豆包、元宝)来获取答案,节省 Cursor 的 Token 额度。
三、Agent Skills是什么?有什么用?
1. 什么是Agent Skills?
Agent Skills是Cursor中的可复的专家知识包,用于让AI代理在特定任务场景中表现更专业化。
核心特点:
- 模块化:将特定功能封装成独立技能
- 可复用:可以在多个代理之间共享
- 专业化:专注解决特定问题,提供更精准方案
- 使用无感知:用户无需手动调用,Agent 会自动使用
Skills、Rules、MCP、知识库:区别与使用场景
| 技术 | 本质定位 | 主要作用 | 典型使用场景 | 何时加载/触发 |
|---|---|---|---|---|
| Skills | 可复用的专业化「提示包」 | 按需注入领域知识、任务指引,支持动态上下文发现 | 组织最佳实践、项目规范、专用工作流(如 /security-audit、/commit-message) | Agent 自主判断或用户通过 / 手动调用;按需加载 |
| Rules | 持久生效的「行为与风格指令」 | 定义代码风格、架构约束、通用规范,作用于系统提示 | 编码风格、命名约定、架构标准、全局/项目级「始终要遵守」的规则 | 常驻或按规则类型(Always / 按文件 / 按 @ 提及)注入系统提示 |
| MCP | 与外部世界通信的「协议层」 | 标准化接入工具、API、数据库、文件等,扩展 AI 的「手和眼睛」 | 调用外部 API、查数据库、读文件、用浏览器等需要「执行动作」的场景 | 按需加载工具描述;调用时把工具输入输出当作上下文传给模型 |
| 知识库 | 外部可检索的「记忆/资料库」 | 通过 RAG 检索,把相关知识片段注入上下文 | 企业文档、产品说明、私有/实时数据、长篇领域知识 | 查询时检索相关片段,再拼进当前对话的上下文 |
一句话区分:
- Rules:管「怎么想、怎么写」——行为与风格。
- Skills:管「按什么知识、流程来做事」——专业化能力包。
- MCP:管「能调用哪些外部能力」——工具与数据的协议。
- 知识库:管「从哪里找答案」——可检索的资料来源。
从与大模型交互的方式看,这四类技术最终都是在构造「输入给模型的上下文」,因此都可以理解为广义的提示词:
2. 为什么需要Agent Skills?
解决的问题
-
专业知识分散问题
- 问题:不同代理需要相同专业能力,但每个都要重新实现
- 解决:Skills封装可复用模块
-
工具使用复杂性
- 问题:直接使用API需要处理复杂认证、参数、错误处理
- 解决:Skills提供简化接口,隐藏底层细节
-
上下文管理效率
- 问题:代理在不同任务间切换上下文效率低
- 解决:Skills保持特定领域知识和处理流程
-
性能与成本平衡
- 问题:每次调用都加载大量知识参数,成本高
- 解决:Skills可预加载和缓存特定知识
3. 实际应用场景
组织最佳实践类Skills
/security-audit- 内部安全审计规范/performance-review- 性能优化最佳实践/logging-patterns- 日志记录规范
项目通用组件类Skills
/use-api-client- 使用项目API客户端/use-database-layer- 使用数据库访问层/extend-component- 扩展基础组件
4. 如何创建Skills?
可以使用帮你写skills的skills
5. 创建Skills的建议
- 从小做起:先从最常用、最痛的规范开始
- 迭代优化:根据使用反馈持续改进
- 文档化:每个Skill都有清晰的文档说明适用场景
- 版本管理:随着规范演进,Skills也要相应更新
总结
一、模型选择核心要点
根据场景选择合适的模型,避坑低性价比模型,可以经常换着用,找到适合自己的模型
二、节省Token核心要点
- 精准定位代码,精准描述问题,尽量避免让AI自己去检索
- 控制上下文长度,及时开启新对话/总结上下文
- 善用Plan模式,简单问题可以用代码补全,通用问题问免费的工具
三、Agent Skills
和 Rules、MCP、RAG 本质上都是提示词工程。Skills 的特点是按需注入,使用门槛低,自动使用,可以根据自己项目实际情况自己写 Skills,可用性更高一些。
可以将项目内的最佳实践、项目通用的组件写到 Skills 里
参考资源:
- SWE-bench排行榜:www.swebench.com/
- Cursor官方文档:cursor.com/cn/docs
- Agent Skills规范:agentskills.io/home
- skillsmp: skillsmp.com/categories/…