Agentic Engineering时代到来:GLM 5.0发布,Agent Team + Kimi K2.5/GLM 对比实测100个小游戏网站

0 阅读7分钟

GLM 5.0上线了!!

学界与业界正逐渐形成一种共识,大模型从写代码、写前端,进化到写工程、完成大任务,即从“Vibe Coding”变革为“Agentic Engineering”。

GLM-5 正是这一变革的产物:在 Coding 与 Agent 能力上,取得开源 SOTA 表现,在真实编程场景的使用体感逼近 Claude Opus 4.5,擅长复杂系统工程与长程 Agent 任务。

在全球权威的 Artificial Analysis 榜单中,GLM-5 位居全球第四、开源第一。

公众号:智谱GLM-5开源:从代码到工程,Agentic Engineering时代最好的开源模型

文章中说,我们要从Vibe Coding时代变革为 Agentic Engineering的时代,个人理解也就是不仅要快,还要协作,还要一次做对。

Vibe Coding的效率瓶颈,本质上是串行处理还有质量的问题。

但Anthropic新的Agent Team机制和GLM 5.0 超强的模型,一下子把这2个痛点都解决了!


01

从单向汇报到双向通信

传统的Subagent能够实现并行处理,但只能向主Agent单向汇报结果,Subagent之间无法通信,最终如果某个subagent做错了,于是就要重来。

子代理之间互不知情,更无法讨论质疑。

Agent Teams实现了网状通信拓扑:队员之间可以直接对话、互相质疑、协同决策。

最重要的是AgentTeams的每个Agent拥有自己的独立上下文窗口。

这样就不容易乱,也不容易出现幻觉,让AI只完成一件事情的时候,它能够把这件事情做得更好。


02

核心组件与工作原理

Agent Teams由四个核心组件构成:

组件职责技术实现
Team Lead任务拆分、分配、汇总主Claude Code session
Teammates独立执行任务独立Claude实例 + 独立上下文
Task List任务状态管理本地文件:~/.claude/tasks/
MailboxAgent间通信消息系统,支持message/broadcast

除了Task List还有一个Team Config,它是一个成员数组,包含每个队员的姓名、代理ID和代理类型。

配图4

每个队友可以阅读这个文件用于了解其他队员是谁,能够做一些什么,并且通过Mailbox来实现相互之间的通信。

而任务列表的作用在于团队协作,负责人可以分配任务,队友们也可以自己申领任务。

任务会通过状态来管理,也包括依赖关系,它还有一个很巧妙的任务认领机制来避免冲突。


03

和现有多Agent机制的差异

2026年1月27日至2月5日,短短十天内,三家头部公司相继发布多Agent产品:

日期公司产品核心特点
01-27Moonshot AIKimi K2.5 Agent 集群全自动编排,最多100个Agent
02-02OpenAICodex并行Agent桌面端多Agent并行开发
02-05AnthropicClaude Opus 4.6 + Agent Teams多Agent相互协作

Kimi 2.5的集群是将任务极度拆解,并行完成,个人理解它强化的是分工、效率、速度还有性能。

Codex的桌面版给了我们一个更方便并行完成多个任务的窗口,但它不知道别人做了什么,例如

而Claude Code,则是让我们更加省心,让Agent自己协作。

那到底表现得怎么样呢?

接下来继续用Kimi K2.5和GLM 5.0 + Claude Code +Agent Team来实战


04

Kimi 实测:星露谷挖矿 & 小游戏 html网站

首先,你要有Agent Team的前提是,你有Agent。

打开Claude Code,输入这段Prompt

https://github.com/wshobson/agents把这些Agents 全部安装到我的 ClaudeCodeClI里, 跳过重复的

如果你已经安装完了,就不用管了,没安装,就让它继续安装。

不知道自己有什么的,输入这段Prompt

列出我所有的agent,告诉我他们有什么作用。

第二步,更新你的Claude Code最新版,然后打开你的Claude Code让它帮你开启这个模式

Prompt也特别简单

参考这个文档,打开agent team模式https://code.claude.com/docs/en/agent-teams#start-your-first-agent-team

开启后,接下来是我的实战演示。

首先先看结果,林克在挖矿,能够支持放炸弹,挥铲子,自动捡东西。然后进入下一层。

我告诉AI我要做一个简单版的星露谷挖矿场景,用网站模拟,启动agent team。

这时候它启动了团队准备了开发框架,在这个同时它还问了我问题,等待的过程中已经开始开发了。

没过一会(大概是15分钟左右)它开发完了,但UI特别炸裂。

这里星露谷的点在哪?

继续指挥AI,让它反省。

还是不够好,过程中我在想,这个人物能不能换成林克。

命令是发出去了,但结果还是不太行

这个小绿人也不能说不林克,那个帽子和装扮我还是知道是啥服装的....

于是我又再次让gemini画了幅画,考验了下kimi的识图画图能力,果然我可能还是太会给Kimi上强度了。

好的,这时给了我一个圣诞老人。

最后忍无可忍,让Google AI Studio 给我把这幅图点阵绘图一下,让我给Kimi。

AI Studio真好啊,直接给了我个转换器,AI为了避免我后面让它转,给了我一个体系化解决方案....

用 HTML 表格的单元格作为像素点,通过背景色控制每个像素的颜色。

在结合参考图+frontend-design这个skills,这是给我最终的结果。

Token消耗部分,只用了199套餐的23%,每天都在为我无法消耗完模型的Token而愧疚。

有了Agent Team,是不是能够烧的更多一点。从效率来看还是很高效的。

但想了想,忍不了一点,再来。花叔用Claude 4.6成功过,我们试试kimi行不行。

快乐,就是如此的简单,据说要很久,此刻已经周三晚上12点13分了,让我看看它的计时。

12:44分的时候有了32个游戏能玩,我去体验一下射箭的游戏,这个是可以的,但其他大部分都失败了。

不错,真的能玩!!!到这里,我就去睡觉了(第二天其实也还是没成功)

于是进一步对 KIMI输出。

经过几轮输出后,这个时候给我的像样多了。

https://github.com/WiseWong6/kimi-game

对比花叔的实践,Kimi老师对比Claude老师还是有很多的差距,我把链接放在了vercel,但还是很强了!!很短的时间做完了这些。

https://kimi-game.vercel.app/

有兴趣的可以去玩玩~


05

GLM 5.0 实测:100个小游戏 html网站

早上起床的时候,GLM5.0发布了,这篇文章本来含泪的要过期了。

但GLM 5.0只对MAX开放,而且涨价了!Pro要升级要多花3k大洋,贫穷的我得到了善良的读者朋友的拯救!!!

他使用了我的Prompt 去测试了能不能一波出100个H5小游戏,先看成果。

时间的部分,我10点14分在和读者老师聊天,发给了他我调API失败了。

然后老师10点56分就发给了我压缩包,也就是41分钟左右就完成了任务。

从日志看,启动了多个Agent一起完成了任务。

整体体验来说,视觉没经过调优达到了能看的水平,至少不是报错的图片,其次自己增加了游戏说明对于用户很友好,这一点我还是要和Kimi强调的。

最终就是,真的是每个游戏都能玩啊....这个体感真的就像GLM说的体感逼近 Claude Opus 4.5了。

体验链接在下面,有兴趣的朋友可以玩玩

https://game-glm5.vercel.app/

配图1

未来的开发效率,属于能够组织多个Agent协同解决复杂问题的开发者。

那我们的价值会慢慢变成了定义问题的边界,在模糊需求中锚定真问题。在于技术与业务的判断,在不确定性中选择确定的部分。


原文 :mp.weixin.qq.com/s/mO_muup-W…