Agentic Engineering时代到来：GLM 5.0发布，Agent Team + Kimi K2.5/GLM 对比实测100个小游戏网站

GLM 5.0上线了！！

学界与业界正逐渐形成一种共识，大模型从写代码、写前端，进化到写工程、完成大任务，即从“Vibe Coding”变革为“Agentic Engineering”。

GLM-5 正是这一变革的产物：在 Coding 与 Agent 能力上，取得开源 SOTA 表现，在真实编程场景的使用体感逼近 Claude Opus 4.5，擅长复杂系统工程与长程 Agent 任务。

在全球权威的 Artificial Analysis 榜单中，GLM-5 位居全球第四、开源第一。

公众号：智谱GLM-5开源：从代码到工程，Agentic Engineering时代最好的开源模型

文章中说，我们要从Vibe Coding时代变革为 Agentic Engineering的时代，个人理解也就是不仅要快，还要协作，还要一次做对。

Vibe Coding的效率瓶颈，本质上是串行处理还有质量的问题。

但Anthropic新的Agent Team机制和GLM 5.0 超强的模型，一下子把这2个痛点都解决了！

01 从单向汇报到双向通信

传统的Subagent能够实现并行处理，但只能向主Agent单向汇报结果，Subagent之间无法通信，最终如果某个subagent做错了，于是就要重来。

子代理之间互不知情，更无法讨论质疑。

Agent Teams实现了网状通信拓扑：队员之间可以直接对话、互相质疑、协同决策。

最重要的是AgentTeams的每个Agent拥有自己的独立上下文窗口。

这样就不容易乱，也不容易出现幻觉，让AI只完成一件事情的时候，它能够把这件事情做得更好。

02 核心组件与工作原理

Agent Teams由四个核心组件构成：

组件	职责	技术实现
Team Lead	任务拆分、分配、汇总	主Claude Code session
Teammates	独立执行任务	独立Claude实例 + 独立上下文
Task List	任务状态管理	本地文件：`~/.claude/tasks/`
Mailbox	Agent间通信	消息系统，支持message/broadcast

除了Task List还有一个Team Config，它是一个成员数组，包含每个队员的姓名、代理ID和代理类型。

配图4

每个队友可以阅读这个文件用于了解其他队员是谁，能够做一些什么，并且通过Mailbox来实现相互之间的通信。

而任务列表的作用在于团队协作，负责人可以分配任务，队友们也可以自己申领任务。

任务会通过状态来管理，也包括依赖关系，它还有一个很巧妙的任务认领机制来避免冲突。

03 和现有多Agent机制的差异

2026年1月27日至2月5日，短短十天内，三家头部公司相继发布多Agent产品：

日期	公司	产品	核心特点
01-27	Moonshot AI	Kimi K2.5 Agent 集群	全自动编排，最多100个Agent
02-02	OpenAI	Codex并行Agent	桌面端多Agent并行开发
02-05	Anthropic	Claude Opus 4.6 + Agent Teams	多Agent相互协作

Kimi 2.5的集群是将任务极度拆解，并行完成，个人理解它强化的是分工、效率、速度还有性能。

Codex的桌面版给了我们一个更方便并行完成多个任务的窗口，但它不知道别人做了什么，例如

而Claude Code，则是让我们更加省心，让Agent自己协作。

那到底表现得怎么样呢？

接下来继续用Kimi K2.5和GLM 5.0 + Claude Code +Agent Team来实战

04 Kimi 实测：星露谷挖矿 & 小游戏 html网站

首先，你要有Agent Team的前提是，你有Agent。

打开Claude Code，输入这段Prompt

https://github.com/wshobson/agents把这些Agents 全部安装到我的 ClaudeCodeClI里, 跳过重复的

如果你已经安装完了，就不用管了，没安装，就让它继续安装。

不知道自己有什么的，输入这段Prompt

列出我所有的agent，告诉我他们有什么作用。

第二步，更新你的Claude Code最新版，然后打开你的Claude Code让它帮你开启这个模式

Prompt也特别简单

参考这个文档，打开agent team模式https://code.claude.com/docs/en/agent-teams#start-your-first-agent-team

开启后，接下来是我的实战演示。

首先先看结果，林克在挖矿，能够支持放炸弹，挥铲子，自动捡东西。然后进入下一层。

我告诉AI我要做一个简单版的星露谷挖矿场景，用网站模拟，启动agent team。

这时候它启动了团队准备了开发框架，在这个同时它还问了我问题，等待的过程中已经开始开发了。

没过一会（大概是15分钟左右）它开发完了，但UI特别炸裂。

这里星露谷的点在哪？

继续指挥AI，让它反省。

还是不够好，过程中我在想，这个人物能不能换成林克。

命令是发出去了，但结果还是不太行

这个小绿人也不能说不林克，那个帽子和装扮我还是知道是啥服装的....

于是我又再次让gemini画了幅画，考验了下kimi的识图画图能力，果然我可能还是太会给Kimi上强度了。

好的，这时给了我一个圣诞老人。

最后忍无可忍，让Google AI Studio 给我把这幅图点阵绘图一下，让我给Kimi。

AI Studio真好啊，直接给了我个转换器，AI为了避免我后面让它转，给了我一个体系化解决方案....

用 HTML 表格的单元格作为像素点，通过背景色控制每个像素的颜色。

在结合参考图+frontend-design这个skills，这是给我最终的结果。

Token消耗部分，只用了199套餐的23%，每天都在为我无法消耗完模型的Token而愧疚。

有了Agent Team，是不是能够烧的更多一点。从效率来看还是很高效的。

但想了想，忍不了一点，再来。花叔用Claude 4.6成功过，我们试试kimi行不行。

快乐，就是如此的简单，据说要很久，此刻已经周三晚上12点13分了，让我看看它的计时。

12:44分的时候有了32个游戏能玩，我去体验一下射箭的游戏，这个是可以的，但其他大部分都失败了。

不错，真的能玩！！！到这里，我就去睡觉了（第二天其实也还是没成功）

于是进一步对 KIMI输出。

经过几轮输出后，这个时候给我的像样多了。

https://github.com/WiseWong6/kimi-game

对比花叔的实践，Kimi老师对比Claude老师还是有很多的差距，我把链接放在了vercel，但还是很强了！！很短的时间做完了这些。

https://kimi-game.vercel.app/

有兴趣的可以去玩玩~

05 GLM 5.0 实测：100个小游戏 html网站

早上起床的时候，GLM5.0发布了，这篇文章本来含泪的要过期了。

但GLM 5.0只对MAX开放，而且涨价了！Pro要升级要多花3k大洋，贫穷的我得到了善良的读者朋友的拯救！！！

他使用了我的Prompt 去测试了能不能一波出100个H5小游戏，先看成果。

时间的部分，我10点14分在和读者老师聊天，发给了他我调API失败了。

然后老师10点56分就发给了我压缩包，也就是41分钟左右就完成了任务。

从日志看，启动了多个Agent一起完成了任务。

整体体验来说，视觉没经过调优达到了能看的水平，至少不是报错的图片，其次自己增加了游戏说明对于用户很友好，这一点我还是要和Kimi强调的。

最终就是，真的是每个游戏都能玩啊....这个体感真的就像GLM说的体感逼近 Claude Opus 4.5了。

体验链接在下面，有兴趣的朋友可以玩玩

https://game-glm5.vercel.app/

配图1

未来的开发效率，属于能够组织多个Agent协同解决复杂问题的开发者。

那我们的价值会慢慢变成了定义问题的边界，在模糊需求中锚定真问题。在于技术与业务的判断，在不确定性中选择确定的部分。

原文：mp.weixin.qq.com/s/mO_muup-W…