GLM 5.0上线了!!
学界与业界正逐渐形成一种共识,大模型从写代码、写前端,进化到写工程、完成大任务,即从“Vibe Coding”变革为“Agentic Engineering”。
GLM-5 正是这一变革的产物:在 Coding 与 Agent 能力上,取得开源 SOTA 表现,在真实编程场景的使用体感逼近 Claude Opus 4.5,擅长复杂系统工程与长程 Agent 任务。
在全球权威的 Artificial Analysis 榜单中,GLM-5 位居全球第四、开源第一。
文章中说,我们要从Vibe Coding时代变革为 Agentic Engineering的时代,个人理解也就是不仅要快,还要协作,还要一次做对。
Vibe Coding的效率瓶颈,本质上是串行处理还有质量的问题。
但Anthropic新的Agent Team机制和GLM 5.0 超强的模型,一下子把这2个痛点都解决了!
01
从单向汇报到双向通信
传统的Subagent能够实现并行处理,但只能向主Agent单向汇报结果,Subagent之间无法通信,最终如果某个subagent做错了,于是就要重来。
子代理之间互不知情,更无法讨论质疑。
Agent Teams实现了网状通信拓扑:队员之间可以直接对话、互相质疑、协同决策。
最重要的是AgentTeams的每个Agent拥有自己的独立上下文窗口。
这样就不容易乱,也不容易出现幻觉,让AI只完成一件事情的时候,它能够把这件事情做得更好。
02
核心组件与工作原理
Agent Teams由四个核心组件构成:
| 组件 | 职责 | 技术实现 |
|---|---|---|
| Team Lead | 任务拆分、分配、汇总 | 主Claude Code session |
| Teammates | 独立执行任务 | 独立Claude实例 + 独立上下文 |
| Task List | 任务状态管理 | 本地文件:~/.claude/tasks/ |
| Mailbox | Agent间通信 | 消息系统,支持message/broadcast |
除了Task List还有一个Team Config,它是一个成员数组,包含每个队员的姓名、代理ID和代理类型。
每个队友可以阅读这个文件用于了解其他队员是谁,能够做一些什么,并且通过Mailbox来实现相互之间的通信。
而任务列表的作用在于团队协作,负责人可以分配任务,队友们也可以自己申领任务。
任务会通过状态来管理,也包括依赖关系,它还有一个很巧妙的任务认领机制来避免冲突。
03
和现有多Agent机制的差异
2026年1月27日至2月5日,短短十天内,三家头部公司相继发布多Agent产品:
| 日期 | 公司 | 产品 | 核心特点 |
|---|---|---|---|
| 01-27 | Moonshot AI | Kimi K2.5 Agent 集群 | 全自动编排,最多100个Agent |
| 02-02 | OpenAI | Codex并行Agent | 桌面端多Agent并行开发 |
| 02-05 | Anthropic | Claude Opus 4.6 + Agent Teams | 多Agent相互协作 |
Kimi 2.5的集群是将任务极度拆解,并行完成,个人理解它强化的是分工、效率、速度还有性能。
Codex的桌面版给了我们一个更方便并行完成多个任务的窗口,但它不知道别人做了什么,例如
而Claude Code,则是让我们更加省心,让Agent自己协作。
那到底表现得怎么样呢?
接下来继续用Kimi K2.5和GLM 5.0 + Claude Code +Agent Team来实战
04
Kimi 实测:星露谷挖矿 & 小游戏 html网站
首先,你要有Agent Team的前提是,你有Agent。
打开Claude Code,输入这段Prompt
https://github.com/wshobson/agents把这些Agents 全部安装到我的 ClaudeCodeClI里, 跳过重复的
如果你已经安装完了,就不用管了,没安装,就让它继续安装。
不知道自己有什么的,输入这段Prompt
列出我所有的agent,告诉我他们有什么作用。
第二步,更新你的Claude Code最新版,然后打开你的Claude Code让它帮你开启这个模式
Prompt也特别简单
参考这个文档,打开agent team模式https://code.claude.com/docs/en/agent-teams#start-your-first-agent-team
开启后,接下来是我的实战演示。
首先先看结果,林克在挖矿,能够支持放炸弹,挥铲子,自动捡东西。然后进入下一层。
我告诉AI我要做一个简单版的星露谷挖矿场景,用网站模拟,启动agent team。
这时候它启动了团队准备了开发框架,在这个同时它还问了我问题,等待的过程中已经开始开发了。
没过一会(大概是15分钟左右)它开发完了,但UI特别炸裂。
这里星露谷的点在哪?
继续指挥AI,让它反省。
还是不够好,过程中我在想,这个人物能不能换成林克。
命令是发出去了,但结果还是不太行
这个小绿人也不能说不林克,那个帽子和装扮我还是知道是啥服装的....
于是我又再次让gemini画了幅画,考验了下kimi的识图画图能力,果然我可能还是太会给Kimi上强度了。
好的,这时给了我一个圣诞老人。
最后忍无可忍,让Google AI Studio 给我把这幅图点阵绘图一下,让我给Kimi。
AI Studio真好啊,直接给了我个转换器,AI为了避免我后面让它转,给了我一个体系化解决方案....
用 HTML 表格的单元格作为像素点,通过背景色控制每个像素的颜色。
在结合参考图+frontend-design这个skills,这是给我最终的结果。
Token消耗部分,只用了199套餐的23%,每天都在为我无法消耗完模型的Token而愧疚。
有了Agent Team,是不是能够烧的更多一点。从效率来看还是很高效的。
但想了想,忍不了一点,再来。花叔用Claude 4.6成功过,我们试试kimi行不行。
快乐,就是如此的简单,据说要很久,此刻已经周三晚上12点13分了,让我看看它的计时。
12:44分的时候有了32个游戏能玩,我去体验一下射箭的游戏,这个是可以的,但其他大部分都失败了。
不错,真的能玩!!!到这里,我就去睡觉了(第二天其实也还是没成功)
于是进一步对 KIMI输出。
经过几轮输出后,这个时候给我的像样多了。
https://github.com/WiseWong6/kimi-game
对比花叔的实践,Kimi老师对比Claude老师还是有很多的差距,我把链接放在了vercel,但还是很强了!!很短的时间做完了这些。
https://kimi-game.vercel.app/
有兴趣的可以去玩玩~
05
GLM 5.0 实测:100个小游戏 html网站
早上起床的时候,GLM5.0发布了,这篇文章本来含泪的要过期了。
但GLM 5.0只对MAX开放,而且涨价了!Pro要升级要多花3k大洋,贫穷的我得到了善良的读者朋友的拯救!!!
他使用了我的Prompt 去测试了能不能一波出100个H5小游戏,先看成果。
时间的部分,我10点14分在和读者老师聊天,发给了他我调API失败了。
然后老师10点56分就发给了我压缩包,也就是41分钟左右就完成了任务。
从日志看,启动了多个Agent一起完成了任务。
整体体验来说,视觉没经过调优达到了能看的水平,至少不是报错的图片,其次自己增加了游戏说明对于用户很友好,这一点我还是要和Kimi强调的。
最终就是,真的是每个游戏都能玩啊....这个体感真的就像GLM说的体感逼近 Claude Opus 4.5了。
体验链接在下面,有兴趣的朋友可以玩玩
https://game-glm5.vercel.app/
未来的开发效率,属于能够组织多个Agent协同解决复杂问题的开发者。
那我们的价值会慢慢变成了定义问题的边界,在模糊需求中锚定真问题。在于技术与业务的判断,在不确定性中选择确定的部分。