你是否遇到过以下情况:
提示词写了又写,模型还是听不懂。换个项目,提示词就得推翻重来。长对话跑了几十轮,agent开始"失忆",你前面交代过的约束它全忘了。 日常用 Claude Code 写代码还有一种情况:跟 agent 来回改了好几轮,最后发现一开始把需求讲清楚,很多弯路根本不用走。
这几个问题,根上指向同一件事。
2026 年 Skills 很火,但剥开外壳,Skills 的本质是"约束性提示词"。Skills 为什么能让模型输出变好?我的理解是:输出质量 ≈ 提示词 × 上下文 × 模型能力。模型能力短期改不了,上下文也有上限,能抓住的变量就是提示词。Skills 帮你把提示词写到了靠手写很难达到的质量,这才是它管用的原因。
那怎么写出更好的提示词?PromptCraft 就是干这个的。不止帮你写,还帮你把用过的经验留住,换了项目、换了人、甚至换了 AI 工具,沉淀下来的经验照样能被捡起来。
七种技术,不用你自己选
PromptCraft 内置了 7 种 prompt 工程技术:零样本提示、少样本提示、零样本思维链、少样本思维链、最少到最多提示、后退提示 、思维树提示。每种都配了设计规则、输入模板和输出模板。
从零手写这些结构,很花时间,而且选哪种,大部分人心里也没底。PromptCraft 的 LLM Router 会根据任务的独立性和认知复杂度自己判断:简单独立的任务走零样本 CoT,多步依赖的任务走最少到最多,创造性任务可能上思维树。你不用选,它帮你选好、写好。
跨轮记忆,提示词之间不是孤立的
一个项目跑下来,很少一次对话就收工。几十上百轮很正常,轮与轮之间的提示词是有联系的,甚至强关联,第二轮的任务很可能依赖 第一轮的结果和约束。但 agent 默认不记这些。
PromptCraft 会在每次执行后让 LLM 把输出总结成结构化 JSON 摘要:任务目标、硬约束、质量评分、违规项,全部存进 vault。下一次新任务进来,先搜 vault,相关历史经验自动带进上下文,不是每次都从零开始。
Vault 存在你的项目文件夹里,JSON + Markdown,人类可读,不满意可以手动改。如果你觉得它写的 prompt 不够好,让它生成下一个版本,不满意继续改,直到你满意为止。想回到老版本,--rollback-to v1 一键回退。
四个模块,一条流水线
整个项目拆成 4 个 Skill:
prompt-craft,核心入口。加载之后自动跑完整流水线:先搜 vault 里有没有相关历史经验,再让 LLM Router 判断该用哪种技巧,然后按 8 段结构把 prompt 搭出来,最后存进 vault。执行完拿到结果,还会分析质量写反馈回去。
prompt-memory,管存储。checkpoint.py 负责写,hydrate.py 负责查。JSON 存索引(一条约 200 token),Markdown 存完整 prompt。追加不覆盖,同一个任务改了好几版,历史全在。
prompt-techniques,7 种技巧的参考库。每种配了设计规则、JSON 输入模板、案例生成规则、搜索策略、输出模板。被其他 Skill 按需拉取,不常驻。
prompt-review,质量审查。6 个维度逐个过:完整性、约束匹配、技巧选择、上下文质量、反模式、边界情况。查出来的问题打 BLOCKER / MAJOR / MINOR 标签,不只是"看一遍",给的是可执行的修改建议。
整套流程跑下来:查询扩展 → vault 加载 → LLM 路由选技巧 → 读技巧详情 → 需要的话生成案例 → 构建 8 段 prompt → 存 vault → 执行 → 分析输出 → 反馈写回 vault。
几个比较有意思的设计
双层 vault,项目级和全局级分开。项目级的存项目特定决策、某个 Bug 的排查过程、技术选型理由,跟着仓库走;全局级的存组织级标准,比如"所有合约必须通过 Certora"、"SQL 必须带 LIMIT"。全局约束写一次,每次 hydrate 自动注入,换项目不丢。hydrate.py 每次查询自动合并两层,GLOBAL 级别的条目无条件注入上下文。
LLM 自己做路由,不调外部 API。路由规则直接写在 SKILL.md 里,宿主模型自己读、自己判断。零 API 费用,零延迟。
查询扩展。vault 里存的是英文 prompt,你用中文搜,传统 Jaccard 完全对不上。查之前先让 LLM 生成跨语言关键词扩展,中文映射到英文同义词,命中率就好很多。零依赖,纯靠 LLM 能力。
执行反馈闭环。不是存完就完了。prompt 执行完,对照硬约束分析输出质量,结构化打分(1-5),违规项列清楚,一起写回 vault。下次类似任务自动翻出来参考,同样的坑不会再踩。
技术选型上几个坚持:纯 Python 标准库,没装 pip 也能跑,不依赖 numpy、不调 openai、不需要 embedding 服务。vault 就是 JSON + Markdown,可读可编辑可 git diff,不锁进私有数据库。分词器自己写的,CJK + 日文假名 + 韩文谚文 + 拉丁 + 西里尔全支持。
怎么开始
一条命令安装,自动检测 Claude Code / Codex / CodeBuddy 目录 python install.py
装完在对话里说"加载 prompt-craft",整条流水线自动跑起来。
写一条全局约束
echo '{"task_id":"org-security","user_intent":"所有合约必须通过 Certora 验证"}' |
python checkpoint.py --global
搜 vault python hydrate.py --query "审计合约安全"
59 个测试,MIT 协议。
github.com/kyrielrving11/PromptCraft-Skills
更多能力不展开了,装一个试试比看文档快。有问题直接开 issue。