我的 Cursor 使用心得: 模型怎么选、Token 怎么省、Skills 怎么用

6 阅读11分钟

〇、概述

AI编程(Vibe Coding)越来越普及,Cursor作为最流行的AI编程工具之一,已经成为很多开发者的日常。但在实际使用中,我们总会遇到一些困惑:模型选择、Token消耗、新功能理解...这些问题直接影响使用体验和成本。

Vibe Coding 已逐渐成为开发者日常工作的重要组成部分,但在实际应用中,模型选择、Token 消耗控制、新功能理解等问题,往往影响开发效率与使用成本。

这份文档基于实际使用经验,总结了三个我开发中遇到的问题:

  • 第一次打开 Cursor,满屏的模型选项,到底该选哪个?

  • 用了一段时间,发现token的额度都不够用, 我应该怎么做才能节省Token?

  • AI 圈天天出新名词,突然冒出来个 Agent Skills,这是啥, 有啥用

一、我应该使用哪个模型?

模型选择需围绕性能(SWE-bench 评分)、价格适用场景三各维度,结合性价比优先级进行决策。以下是我总结四类场景的推荐方案:

评分参考SWE-bench排行榜:www.swebench.com/

SWE-bench的评分依据是提交的代码修复能否让所有相关的测试用例通过。

1. 🚀 顶级编程能力(各家旗舰)

这类模型代表了各家厂商的最强实力。SWE-bench 评分仅供参考,不同模型有不同的"性格"(如 Claude 擅长长文本和代码风格,GPT 擅长逻辑推理,Gemini 擅长多模态和速度)。

整理时间: 2026年1月, 参考当前的SWE-bench评分, cursor官网的定价

模型厂商价格 (输入/输出)特点与适用场景
Claude 4.5 OpusAnthropic5/5 / 25编码天花板。SWE-bench 评分第一 (74.4%)。代码风格优雅,逻辑缜密,极少出错。但价格极贵,适合对代码质量有极致要求且预算充足的项目。
Gemini 3 ProGoogle2/2 / 12综合最强。SWE-bench 评分极高 (74.2%),且价格仅为 Opus 的一半。响应速度快,多模态理解能力强,适合大多数高难度任务。
GPT-5.2OpenAI1.75/1.75 / 14推理专家。逻辑推理能力极强 (71.8%),在复杂算法实现和 Bug 追踪上表现出色。Cursor 对 GPT 系列的适配通常最好(System Prompt 优化)。

2. ⚖️ 日常够用,性价比(主力模型)

兼顾性能与成本,适合 80% 的日常开发(CRUD、重构、写测试)。建议根据个人喜好选择。

模型厂商价格 (输入/输出)特点
GPT-5.1 CodexOpenAI1.25/1.25 / 10编码专项优化。去除了通用对话的冗余能力,专注于代码生成,价格亲民,响应迅速。
Claude 4.5 SonnetAnthropic3/3 / 15均衡之选。比 Opus 便宜,但保留了 Claude 系列优秀的代码理解和长文本能力。适合喜欢 Anthropic 生态的开发者。
Gemini 3 FlashGoogle0.50/0.50 / 3速度与成本。比 Pro 版本便宜很多,但比 2.5 Flash 更聪明。适合需要快速迭代的开发场景。

3. 💰 低成本适合大量Token场景

适合处理超长文档、全局搜索分析、日志分析或生成简单脚本。

模型厂商价格 (输入/输出)特点
Gemini 2.5 FlashGoogle0.30/0.30 / 2.50超长上下文。支持百万级 Token,极其便宜,适合把整个文档扔进去让它总结或翻译。
GPT-5 MiniOpenAI0.25/0.25 / 2OpenAI 轻量版。适合简单的指令执行和格式化任务。
Claude 4.5 HaikuAnthropic1/1 / 5最强轻量级。虽然比上面两个贵,但在轻量级模型中智商最高,适合简单的逻辑处理。
Grok CodexAI0.20/0.20 / 1.50价格地板。适合基础的语法纠错。

4. 🚫 性价比极低,尽量避免使用

这些模型要么价格虚高,要么是旧版本,已被新模型全面超越。

模型避坑理由
GPT-5 Fast价格 (2.5/2.5/20) 甚至比性能更强的 GPT-5.2 和 Gemini 3 Pro 还贵,完全没必要使用。
Claude 4 Sonnet旧版本。价格 (3/3/15) 和新版 4.5 Sonnet 一样,但能力弱很多。务必选择带 "4.5" 的版本。
Claude 4 Sonnet 1M旧版本大窗口版。价格翻倍 (6/6/22.5),完全可以用 Gemini 2.5 Flash 替代,后者更便宜且上下文更长。

二、怎样可以节省Token?

Token 消耗直接关联使用成本,其核心消耗原因在于上下文累积与不合理的使用习惯。通过科学的使用方法,可有效降低 Token 消耗,提升使用效率。

什么会导致Token消耗越来越大?

上下文累积:

每次对话会保留完整上下文,包括用户消息、AI 回复、引用的代码 / 文档, 配置的rules, 加载的mcp, 等等,且每次交互都会重新传递这些内容, 多轮迭代对话会进一步拉长上下文,持续增加 Token 消耗。

高消耗场景示例:

  • 长时间单窗口对话(10 轮以上):上下文呈指数级增长;
  • 大文件无差别引用:直接引用数千行配置文件、日志文件,一次性消耗大量 Token;
  • 多主题混合对话:同一窗口中讨论不相关话题,导致上下文冗余杂乱;

1. 精准定位需求与代码

描述具体问题,避免让 AI 猜测:

❌ 不推荐: "帮我看看这个文件有什么问题"

✅ 推荐: "@src/components/UserForm.vue 第45行的handleSubmit函数中,表单验证逻辑有问题"

合理引用,避免让 AI 自行检索:

❌ 不推荐: "参考用户卡片组件的样式改一下"(还需要 AI 去找用户卡片)

✅ 推荐: "请参照 @/components/UserCard.tsx 的卡片样式,为当前组件添加阴影效果和圆角"

实用技巧:

  • 利用 @文件名 精准指定文件,#函数名 定位特定函数/类
  • 直接选中代码片段,Cursor 会自动完成引用
  • 清晰描述问题现象、预期结果,提供完整上下文信息

2. 使用Plan模式

对于复杂任务,使用 Plan 模式可以:

  1. 先让 AI 提出澄清问题
  2. 分析代码库获取相关上下文
  3. 创建完整实现计划, 审阅并编辑计划
  4. 确认后再执行

该模式可减少多轮反复沟通,集中处理核心需求,显著降低 Token 消耗。

3. 优化上下文管理

规则固化: 将重复使用的提示、项目规范写入 .cursor/rules 文件,避免重复说明。 Rules 最佳实践:

  • 篇幅控制在 500 行以内,避免信息过载
  • 提供具体示例,增强可操作性
  • 聚焦明确的规则点,避免模糊表述
  • 覆盖编码风格、命名规范、架构约束等核心场景

主题聚焦: 同一对话窗口仅处理一个功能模块或一类问题,高度相关任务可合并。及时开启新对话,避免冗余累积。

上下文压缩: 如果对话已经很长,但确实需要继续提问,可以使用:

  • 内置功能:使用 Cursor 的 "/Summarize" 命令,自动提取对话关键信息,剔除冗余内容
  • 手动操作:定期让 AI 生成对话摘要,以摘要作为后续对话的基础上下文

4. 其他技巧

善用代码补全,不必事事询问 AI:

  • 对于极其简单的修改(如更改文字、调整间距、修改颜色值),直接定位到代码位置手动修改即可
  • 一旦改过一处,AI 的补全机制往往能自动帮你完成其他相似位置的修改
  • 对于小的、局部的改动,可以用"先写注释,再让 AI 补全"的方式来实现
  • 大部分 AI 工具的自动补全不占用对话额度

合理使用免费 AI 工具: 对于通用性问题(如某个 API 怎么用、实现某个功能有哪些方案),可以使用免费的 AI 工具(如豆包、元宝)来获取答案,节省 Cursor 的 Token 额度。

三、Agent Skills是什么?有什么用?

1. 什么是Agent Skills?

Agent Skills是Cursor中的可复的专家知识包,用于让AI代理在特定任务场景中表现更专业化。

核心特点:

  • 模块化:将特定功能封装成独立技能
  • 可复用:可以在多个代理之间共享
  • 专业化:专注解决特定问题,提供更精准方案
  • 使用无感知:用户无需手动调用,Agent 会自动使用

Skills、Rules、MCP、知识库:区别与使用场景

技术本质定位主要作用典型使用场景何时加载/触发
Skills可复用的专业化「提示包」按需注入领域知识、任务指引,支持动态上下文发现组织最佳实践、项目规范、专用工作流(如 /security-audit/commit-messageAgent 自主判断或用户通过 / 手动调用;按需加载
Rules持久生效的「行为与风格指令」定义代码风格、架构约束、通用规范,作用于系统提示编码风格、命名约定、架构标准、全局/项目级「始终要遵守」的规则常驻或按规则类型(Always / 按文件 / 按 @ 提及)注入系统提示
MCP与外部世界通信的「协议层」标准化接入工具、API、数据库、文件等,扩展 AI 的「手和眼睛」调用外部 API、查数据库、读文件、用浏览器等需要「执行动作」的场景按需加载工具描述;调用时把工具输入输出当作上下文传给模型
知识库外部可检索的「记忆/资料库」通过 RAG 检索,把相关知识片段注入上下文企业文档、产品说明、私有/实时数据、长篇领域知识查询时检索相关片段,再拼进当前对话的上下文

一句话区分:

  • Rules:管「怎么想、怎么写」——行为与风格。
  • Skills:管「按什么知识、流程来做事」——专业化能力包。
  • MCP:管「能调用哪些外部能力」——工具与数据的协议。
  • 知识库:管「从哪里找答案」——可检索的资料来源。

从与大模型交互的方式看,这四类技术最终都是在构造「输入给模型的上下文」,因此都可以理解为广义的提示词

2. 为什么需要Agent Skills?

解决的问题

  1. 专业知识分散问题

    • 问题:不同代理需要相同专业能力,但每个都要重新实现
    • 解决:Skills封装可复用模块
  2. 工具使用复杂性

    • 问题:直接使用API需要处理复杂认证、参数、错误处理
    • 解决:Skills提供简化接口,隐藏底层细节
  3. 上下文管理效率

    • 问题:代理在不同任务间切换上下文效率低
    • 解决:Skills保持特定领域知识和处理流程
  4. 性能与成本平衡

    • 问题:每次调用都加载大量知识参数,成本高
    • 解决:Skills可预加载和缓存特定知识

3. 实际应用场景

组织最佳实践类Skills

  • /security-audit - 内部安全审计规范
  • /performance-review - 性能优化最佳实践
  • /logging-patterns - 日志记录规范

项目通用组件类Skills

  • /use-api-client - 使用项目API客户端
  • /use-database-layer - 使用数据库访问层
  • /extend-component - 扩展基础组件

4. 如何创建Skills?

可以使用帮你写skills的skills

skill-writer

5. 创建Skills的建议

  1. 从小做起:先从最常用、最痛的规范开始
  2. 迭代优化:根据使用反馈持续改进
  3. 文档化:每个Skill都有清晰的文档说明适用场景
  4. 版本管理:随着规范演进,Skills也要相应更新

总结

一、模型选择核心要点

根据场景选择合适的模型,避坑低性价比模型,可以经常换着用,找到适合自己的模型

二、节省Token核心要点

  • 精准定位代码,精准描述问题,尽量避免让AI自己去检索
  • 控制上下文长度,及时开启新对话/总结上下文
  • 善用Plan模式,简单问题可以用代码补全,通用问题问免费的工具

三、Agent Skills

和 Rules、MCP、RAG 本质上都是提示词工程。Skills 的特点是按需注入,使用门槛低,自动使用,可以根据自己项目实际情况自己写 Skills,可用性更高一些。

可以将项目内的最佳实践、项目通用的组件写到 Skills 里

参考资源: