3000行代码长出无限技能:AI Agent自我进化时代来了

2 阅读6分钟

导读

4月17日的GitHub Trending出现了一个值得注意的信号:两个"自我进化"Agent框架——Evolver和GenericAgent——同时登上热榜,分别拿到750和848颗今日新星。

这不是巧合。

过去一年,Agent领域的主旋律是"给Agent更多工具":更长的上下文、更多的API、更复杂的编排框架。但这两个项目指向一个完全不同的方向——让Agent自己学会新技能,而不是等人类教它

如果你在做Agent相关的产品或研究,这篇文章拆解的两条技术路线,可能会改变你对Agent架构的基本判断。

路线一:Evolver——用"基因进化"让Agent的提示词自动升级

Evolver的核心思路很硬核:把生物进化的逻辑搬到Agent的提示词管理上。

它发明了一套叫GEP(Genome Evolution Protocol,基因组进化协议)的东西。听着复杂,拆开看其实很直觉:

基因(Gene):每一条提示词修改策略就是一个"基因"。比如"当Agent遇到API超时,自动切换到缓存模式"——这就是一个基因,包含了触发条件、修改方案和验证命令。

胶囊(Capsule):把多个相关基因打包在一起。比如"错误恢复"这个胶囊里,可能包含超时处理、重试策略、降级方案等一组基因。

进化事件(EvolutionEvent):每次基因被选中并应用的过程,都会被完整记录——什么信号触发了这次进化、选了哪个基因、验证结果如何。这是一条不可篡改的审计日志。

整个流程是这样运转的:

Agent在日常工作中产生日志 → Evolver扫描日志,提取错误模式和性能信号 → 从基因库中匹配最合适的基因 → 执行验证命令确认安全 → 生成新的提示词指令 → 记录整个过程。

关键细节:Evolver不会自动执行任何代码修改。它只生成指导性的提示词,所有实际操作需要宿主运行时解释执行。这意味着安全边界是明确的——它是一个"参谋",不是"执行者"。

更有意思的是它的四种策略模式:

  • balanced(平衡模式):50%创新 + 30%优化 + 20%修复——日常运行的默认状态
  • innovate(创新模式):80%的权重给新功能——系统稳定时加速探索
  • harden(加固模式):40%修复——刚做完大改动,需要收敛
  • repair-only(紧急修复):全力修bug

这不就是一个工程团队的sprint策略吗?只不过决策者从Tech Lead变成了算法。

路线二:GenericAgent——3000行种子代码,长出你独有的技能树

GenericAgent的哲学完全不同,它走的是"极简内核 + 无限生长"路线。

整个框架的核心代码只有大约3000行。9个原子工具(运行代码、读写文件、浏览网页、执行JS、屏幕视觉、移动设备控制)加上一个100行左右的Agent循环——这就是全部。

但它的杀手锏在于"技能结晶"机制:

新任务来了 → Agent自主探索解决方案 → 解决过程被自动"结晶"成一个可复用的技能 → 存入记忆系统 → 下次遇到类似任务,直接调用技能,不再从头探索。

举个具体例子:你让它"监控某只股票,价格异常时提醒我"。第一次,它会自己安装依赖、构建爬虫、配置定时任务、设置告警——整个过程可能折腾一阵子。但这个过程完成后,它就"学会了"这个技能。下次再有类似的监控需求,几秒钟搞定。

它的记忆系统是分层的,非常工程化:

  • L0 元规则:行为约束,相当于"宪法"
  • L1 洞察索引:快速路由,帮Agent判断该调用哪个技能
  • L2 全局事实:长期知识库
  • L3 任务技能/SOP:结晶下来的可复用工作流
  • L4 会话存档:每次任务的精华摘要

最让我印象深刻的一句话是项目描述里的:"每个人的实例都会长出一棵独一无二的技能树——世界上没有第二棵一样的。"

从同一颗3000行的种子出发,因为每个人的使用场景不同,最终进化出完全不同的能力集合。这是真正的"个人化AI"。

另外还有一个技术亮点:GenericAgent的上下文消耗不到30K token,而同类框架动辄200K-1M。在token就是成本的今天,这个效率差距直接影响商业可行性。

两条路线的本质区别

把Evolver和GenericAgent放在一起看,它们代表了Agent自我进化的两种根本范式:

Evolver是"集中式进化"——有一个明确的进化引擎在管理、筛选、验证每一次改变。基因库是共享的,进化事件是可审计的。它更适合企业场景:需要可控性、可追溯性、团队协作。

GenericAgent是"分布式进化"——没有中心化的进化引擎,技能从每次任务执行中自然涌现。每个实例独立生长,彼此不同。它更适合个人场景:高度个性化,用得越多越好用。

一个是精心育种,一个是野蛮生长。

但它们有一个共同的底层信念:Agent的能力边界不应该由开发者预先定义

这对从业者意味着什么

做Agent产品的人可能需要重新想一件事:"Agent的技能列表"是否还需要手动维护?未来的竞争力恐怕不在于你预置了多少工具,而在于Agent学习新技能的效率和质量。

做企业AI的人,Evolver那套审计日志和策略模式的思路值得认真看。企业最怕的不是AI不够聪明,而是AI聪明但不可控。"每一次进化都有据可查"这个卖点,比"我们的Agent更强"有说服力得多。

独立开发者的机会可能藏在GenericAgent的"3000行种子"思路里——用户买的不是一个成品Agent,而是一颗种子,然后在自己的使用场景中慢慢"养"出独一无二的AI助手。这是一个还没人真正做出来的产品形态。

结语

  1. Agent自我进化不再是论文里的概念,已经有可运行的开源实现,且GitHub社区正在用星数投票
  2. 两条路线各有适用场景:企业要可控进化(Evolver),个人要个性化生长(GenericAgent)
  3. "技能结晶"机制是GenericAgent最大的创新——把隐性知识显性化,让Agent越用越好用,这是真正的飞轮效应
  4. 开发者的角色正在从"教Agent做事"转向"设计Agent的学习机制"——这是一个根本性的能力转移

行动建议

  • 立即可做:克隆GenericAgent,跑几个自己的日常任务,感受"技能结晶"的效果——3000行代码的门槛非常低
  • 中期关注:观察Evolver的EvoMap Hub生态(技能共享市场),这可能催生一个新的开源商业模式
  • 长期思考:如果Agent能自我进化,那"Agent商店"这个概念是否需要重新想象?也许未来卖的不是Agent,而是"种子"和"基因"