GLM-5我已经用了三天,结论是:GLM-5不再是个"平替",它换了个身份,从码农晋升为架构师。
🚀 立即拼团薅羊毛:智谱 GLM Coding 订阅链接直达,20 + 编程工具无缝支持,越拼越划算,建议大家直接选择MAX模型,避免高峰期间被限流→www.bigmodel.cn/glm-coding?…
Vibe Coding正在过时,Agentic Engineering来了
Karpathy(Vibe Coding概念提出者)自己说:Vibe Coding已经过时了,取而代之的是Agentic Engineering。
Vibe Coding = 你说"帮我写个按钮",AI给你写个按钮 Agentic Engineering = 你说"帮我做个电商系统",AI自己拆任务、自己规划、自己写、自己测、自己修bug,可能跑好几天
Anthropic发Opus 4.6时的案例是什么?16个Claude实例并行工作两周,写了10万行Rust代码的C编译器。
OpenAI发GPT-5.3时强调的是什么?AI参与了自己的训练过程。
趋势很明显:AI编程从"一句话生成"转向"长任务系统工程"。
AI编程分成两条路,GLM-5选了更难的那条
第一条:审美编程(Gemini 3.0 Pro)
- 截图转代码、一句话出漂亮页面、视觉驱动
- 做出来的前端好看,但深度有限
第二条:系统工程(Opus、Codex、GLM-5)
- 后端架构、编译器、微服务、长时间运行的Agent任务
- 不好看,但能用,能干重活
GLM-5选了第二条。这不是偶然,是战略选择。
持久力才是Agentic能力的核心
以前用AI编程,最大的问题是"跑着跑着就忘了自己在干什么"。
GLM-5最大的改进是持久力:
- 2小时重构6500行代码,全程不丢失上下文
- 28分钟走完13步写作流程,一步不跳
这意味着你可以给它一个大任务,让它跑半小时、一小时甚至更久。
这才是真正的自动化工程,不是"你盯着它干完一个函数"。
📊 数据说话:不只是"平替"了
- 综合榜:全球第四、开源第一
- 编程能力:SWE-bench Verified 77.8%(Opus 4.5是80.9%)
- Agent能力:两个榜单拿了全场第一(包括Opus、Gemini、GPT)
官方说"使用体感逼近Opus 4.5"——注意,是逼近,不是追平。
但在很多场景下,GLM-5的表现已经让我觉得"不用每次都切回Opus了"。
价格差距:Opus每百万token 25,GLM编程订阅20元/月。
💭 最后的思考
从GLM-4.5到GLM-5,一年半时间:
- 4.5 = 能用的初级程序员
- 4.6 = 靠谱的中级程序员
- 4.7 = 让人惊喜的高级程序员
- GLM-5 = 架构师
Agentic Engineering时代,开源阵营终于有了自己的架构师。
如果你需要一句话生成漂亮网页,选别的也行。但如果你需要一个能接入Claude Code/OpenClaw帮你做工程的模型,GLM-5必须值得试试。
🚀 立即拼团薅羊毛:智谱 GLM Coding 订阅链接直达,20 + 编程工具无缝支持,越拼越划算,建议大家直接选择MAX模型,避免高峰期间被限流→www.bigmodel.cn/glm-coding?…