一个面向中国教育的 Agent Skill 集合,170 个。如果你觉得这事有价值,帮我点个 Star ⭐
做教育软件五年了。
最开始做托管机构的 SaaS。几百个托管班的校长用我们的系统管考勤、管作业、跟家长沟通。后来做了个 AI 错题本,拍照就能把孩子的错题归到具体知识点上,告诉家长这道题到底是「概念不清」还是「计算跳步」。
说实话,这两个产品教会我的东西,比我前面十年加起来都多。
因为你做教育产品,你不是在跟代码打交道,你是在跟教材打交道。
人教版的勾股定理在八年级下册第 17 章,北师大版的在八年级上册第 1 章。统编版语文的文言文篇目每年微调。中考物理在不同省份的命题侧重点能差出 30% 以上。这些东西,写代码的人不关心。但用你产品的老师、学生、家长,每天都在跟这些细节较劲。
所以去年 Anthropic 搞出 Agent Skills 标准的时候,我第一反应不是「牛逼」,是——这东西能帮我解决教材对齐的问题吗?
一试,果然不行
我装了当时最火的一个编程 Skill,让 Agent 给我出几道初中物理题。它出了一套——力学符号是美式教材那一套,题目风格像 SAT Subject Test。
这不能怪它。这些 Agent 的训练数据里,关于「物理题」的认知大概率来自英文互联网。它压根不知道什么叫「人教版」、什么叫「中考难度」、什么叫「贴近生活场景的力学应用题」。
但我知道。过去五年我做托管系统和错题本,每天接触的就是这些:
- 哪个年级哪个单元是学生的分化点
- 什么难度梯度适合课前预习,什么适合考前冲刺
- 老师出题的时候最在意什么(答案不是唯一标准,解析才是)
- 家长看错题报告的时候第一眼看哪里(不是得分,是「同类错误出现了几次」)
这些经验,说实话,不写出来就烂在脑子里了。
所以我把它们写成了 170 个 Agent Skill。
170 个 Skill 能在 5 个平台上跑
这个数字不是拍脑袋拍的。我一开始只写了十几个,写着写着发现不对——你做了「小学数学同步」,就得做「初中数学同步」吧?做了「人教版」,北师大版、苏教版、鲁科版的用户怎么办?光「教材同步」这一个分类,写完就是 41 个。
然后是每日练习。口算和听写需要的训练逻辑完全不一样——口算追求速度和正确率,听写追求的是「会写的字不写错」。这东西一个 Skill 搞不定,得拆。
考试备考更复杂。中考和高考的命题逻辑不一样;考研英语和四六级的评分标准不一样;公务员申论又完全是另一套思维框架。
最后做完 170 个,我看了眼目录——
- 教材同步 41 个
- 每日练习 28 个
- 考试备考 27 个
- 老师工具 31 个
- 学习核心 15 个
- 阅读写作 10 个
- 家庭教育 8 个
- 语言和职业 10 个
我自己都笑了。这哪是个项目,这是把过去五年做教育的经验全倒出来了。
但更有意思的是技术上的一个问题:怎么让这 170 个东西,不光在我自己用的 Hermes Agent 上跑,还能在 Cursor、Claude Code、OpenClaw、Codex 上跑?
五个平台,目录结构不一样,Skill 格式要求不一样。我试了两种方案都翻了车,最后定下来的是两条线分开走:
SKILL.md 管内容,CLI 管适配。
每个 Skill 的核心逻辑写在一个标准的 SKILL.md 文件里,平台无关。然后写了一套 CLI 工具,npx hermes-edu-skills install cursor --workspace . 这种命令,背后自动把 SKILL.md 转成目标平台要的格式,塞到对应的目录。
对用的人来说,就一行命令。不用管背后的适配逻辑。
参数化这个东西,是跟「穷举」较劲
有个细节值得单独说。如果你把「北师大版六年级上册」「苏教版三年级下册」「人教版九年级全一册」都做成独立 Skill,那得有几百个。而且每加一个版本就翻一倍。
我的做法是把年级、册别、单元、难度、题型、题量全部做成参数。
同一个 Skill,比如 primary-math-rj-textbook-sync,不写死是「三年级」还是「六年级」。Agent 收到你的指令后,自己判断该填什么参数——
你说「五年级下册分数的加减法,基础难度,10 道填空」,它自动 grade=5, volume=下册, unit=4, difficulty=基础, type=填空, count=10。
你说「六年级上册圆的周长,拔高,5 道应用」,参数就变成了另一套。
41 个教材同步 Skill,靠参数化覆盖了 500 多种教材×年级×单元的组合。够用。
把过去五年做的事开出来
为什么开源?MIT 协议,全部扔 GitHub 上。
其实没啥高尚的理由。就是觉得这些东西放在公司仓库里,跟埋了没区别。开出来,至少有三种可能性:
- 有人用了,发现某个年级某个学科的 Skill 不够好,提个 Issue 或者 PR——比我一个人修修补补快多了
- 有人觉得思路对,拿了其中几个 Skill 改一改用到自己的场景里——MIT 协议,随便改
- 最差的情况,没人用——那我损失了什么?什么都没损失
而且我确实觉得,中国教育这个场景,靠一家公司关起门来做,做不深。
教材版本太多了。考纲每年都在调。不同省份的中考命题风格差出一个银河系。小学老师和高中老师的需求几乎没有交集。家长这个角色在整个链条里的位置,在中国和在国外完全是两回事。
这些事不是 170 个 Skill 能解决的。甚至是 1700 个也不够。
但如果这个项目能让一些也在做教育科技的人看到——哦,原来 Agent Skill 可以这么用,原来教材对齐这件事可以这样拆——那它就已经值了。
最后说句实在的
我现在最缺的不是代码,是关注度。
GitHub 上每天有几百个新项目冒出来。一个没有 Star、没有 Fork、没有讨论的项目,跟不存在没区别。
所以如果你读到这里,觉得这东西有点意思——不管你会不会用、不管你是不是做教育的——帮我去 GitHub 点个 Star ⭐。
这真的是目前最能帮到我的方式。
当然,如果你恰好装了 Hermes Agent 或者 Cursor,敲一行试试:
npx hermes-edu-skills install hermes
然后跟你的 Agent 说:「帮我出 5 道八年级下册物理力学的选择题。」
看看出来的题,跟以前有什么不一样。