PromptCraft-Skills——一个帮助生成更好提示词且具有记忆功能的skillsPromptCraft-Ski

你是否遇到过以下情况：

提示词写了又写，模型还是听不懂。换个项目，提示词就得推翻重来。长对话跑了几十轮，agent开始"失忆"，你前面交代过的约束它全忘了。日常用 Claude Code 写代码还有一种情况：跟 agent 来回改了好几轮，最后发现一开始把需求讲清楚，很多弯路根本不用走。

这几个问题，根上指向同一件事。

2026 年 Skills 很火，但剥开外壳，Skills 的本质是"约束性提示词"。Skills 为什么能让模型输出变好？我的理解是：输出质量 ≈ 提示词 × 上下文 × 模型能力。模型能力短期改不了，上下文也有上限，能抓住的变量就是提示词。Skills 帮你把提示词写到了靠手写很难达到的质量，这才是它管用的原因。

那怎么写出更好的提示词？PromptCraft 就是干这个的。不止帮你写，还帮你把用过的经验留住，换了项目、换了人、甚至换了 AI 工具，沉淀下来的经验照样能被捡起来。

七种技术，不用你自己选

PromptCraft 内置了 7 种 prompt 工程技术：零样本提示、少样本提示、零样本思维链、少样本思维链、最少到最多提示、后退提示、思维树提示。每种都配了设计规则、输入模板和输出模板。

从零手写这些结构，很花时间，而且选哪种，大部分人心里也没底。PromptCraft 的 LLM Router 会根据任务的独立性和认知复杂度自己判断：简单独立的任务走零样本 CoT，多步依赖的任务走最少到最多，创造性任务可能上思维树。你不用选，它帮你选好、写好。

跨轮记忆，提示词之间不是孤立的

一个项目跑下来，很少一次对话就收工。几十上百轮很正常，轮与轮之间的提示词是有联系的，甚至强关联，第二轮的任务很可能依赖第一轮的结果和约束。但 agent 默认不记这些。

PromptCraft 会在每次执行后让 LLM 把输出总结成结构化 JSON 摘要：任务目标、硬约束、质量评分、违规项，全部存进 vault。下一次新任务进来，先搜 vault，相关历史经验自动带进上下文，不是每次都从零开始。

Vault 存在你的项目文件夹里，JSON + Markdown，人类可读，不满意可以手动改。如果你觉得它写的 prompt 不够好，让它生成下一个版本，不满意继续改，直到你满意为止。想回到老版本，--rollback-to v1 一键回退。

四个模块，一条流水线

整个项目拆成 4 个 Skill：

prompt-craft，核心入口。加载之后自动跑完整流水线：先搜 vault 里有没有相关历史经验，再让 LLM Router 判断该用哪种技巧，然后按 8 段结构把 prompt 搭出来，最后存进 vault。执行完拿到结果，还会分析质量写反馈回去。

prompt-memory，管存储。checkpoint.py 负责写，hydrate.py 负责查。JSON 存索引（一条约 200 token），Markdown 存完整 prompt。追加不覆盖，同一个任务改了好几版，历史全在。

prompt-techniques，7 种技巧的参考库。每种配了设计规则、JSON 输入模板、案例生成规则、搜索策略、输出模板。被其他 Skill 按需拉取，不常驻。

prompt-review，质量审查。6 个维度逐个过：完整性、约束匹配、技巧选择、上下文质量、反模式、边界情况。查出来的问题打 BLOCKER / MAJOR / MINOR 标签，不只是"看一遍"，给的是可执行的修改建议。

整套流程跑下来：查询扩展 → vault 加载 → LLM 路由选技巧 → 读技巧详情 → 需要的话生成案例 → 构建 8 段 prompt → 存 vault → 执行 → 分析输出 → 反馈写回 vault。

几个比较有意思的设计

双层 vault，项目级和全局级分开。项目级的存项目特定决策、某个 Bug 的排查过程、技术选型理由，跟着仓库走；全局级的存组织级标准，比如"所有合约必须通过 Certora"、"SQL 必须带 LIMIT"。全局约束写一次，每次 hydrate 自动注入，换项目不丢。hydrate.py 每次查询自动合并两层，GLOBAL 级别的条目无条件注入上下文。

LLM 自己做路由，不调外部 API。路由规则直接写在 SKILL.md 里，宿主模型自己读、自己判断。零 API 费用，零延迟。

查询扩展。vault 里存的是英文 prompt，你用中文搜，传统 Jaccard 完全对不上。查之前先让 LLM 生成跨语言关键词扩展，中文映射到英文同义词，命中率就好很多。零依赖，纯靠 LLM 能力。

执行反馈闭环。不是存完就完了。prompt 执行完，对照硬约束分析输出质量，结构化打分（1-5），违规项列清楚，一起写回 vault。下次类似任务自动翻出来参考，同样的坑不会再踩。

技术选型上几个坚持：纯 Python 标准库，没装 pip 也能跑，不依赖 numpy、不调 openai、不需要 embedding 服务。vault 就是 JSON + Markdown，可读可编辑可 git diff，不锁进私有数据库。分词器自己写的，CJK + 日文假名 + 韩文谚文 + 拉丁 + 西里尔全支持。

怎么开始

一条命令安装，自动检测 Claude Code / Codex / CodeBuddy 目录 python install.py

装完在对话里说"加载 prompt-craft"，整条流水线自动跑起来。

写一条全局约束 echo '{"task_id":"org-security","user_intent":"所有合约必须通过 Certora 验证"}' |
python checkpoint.py --global

搜 vault python hydrate.py --query "审计合约安全"

59 个测试，MIT 协议。

github.com/kyrielrving11/PromptCraft-Skills

更多能力不展开了，装一个试试比看文档快。有问题直接开 issue。