AI编程大变天!GLM-5让我见识了什么叫"架构师级"AI

17 阅读3分钟

GLM-5我已经用了三天,结论是:GLM-5不再是个"平替",它换了个身份,从码农晋升为架构师。

🚀 立即拼团薅羊毛:智谱 GLM Coding 订阅链接直达,20 + 编程工具无缝支持,越拼越划算,建议大家直接选择MAX模型,避免高峰期间被限流www.bigmodel.cn/glm-coding?…

Vibe Coding正在过时,Agentic Engineering来了

Karpathy(Vibe Coding概念提出者)自己说:Vibe Coding已经过时了,取而代之的是Agentic Engineering

Vibe Coding = 你说"帮我写个按钮",AI给你写个按钮 Agentic Engineering = 你说"帮我做个电商系统",AI自己拆任务、自己规划、自己写、自己测、自己修bug,可能跑好几天

Anthropic发Opus 4.6时的案例是什么?16个Claude实例并行工作两周,写了10万行Rust代码的C编译器。

OpenAI发GPT-5.3时强调的是什么?AI参与了自己的训练过程。

趋势很明显:AI编程从"一句话生成"转向"长任务系统工程"。

AI编程分成两条路,GLM-5选了更难的那条

第一条:审美编程(Gemini 3.0 Pro)

  • 截图转代码、一句话出漂亮页面、视觉驱动
  • 做出来的前端好看,但深度有限

第二条:系统工程(Opus、Codex、GLM-5)

  • 后端架构、编译器、微服务、长时间运行的Agent任务
  • 不好看,但能用,能干重活

GLM-5选了第二条。这不是偶然,是战略选择。

持久力才是Agentic能力的核心

以前用AI编程,最大的问题是"跑着跑着就忘了自己在干什么"。

GLM-5最大的改进是持久力

  • 2小时重构6500行代码,全程不丢失上下文
  • 28分钟走完13步写作流程,一步不跳

这意味着你可以给它一个大任务,让它跑半小时、一小时甚至更久。

这才是真正的自动化工程,不是"你盯着它干完一个函数"。

📊 数据说话:不只是"平替"了

  • 综合榜:全球第四、开源第一
  • 编程能力:SWE-bench Verified 77.8%(Opus 4.5是80.9%)
  • Agent能力:两个榜单拿了全场第一(包括Opus、Gemini、GPT)

官方说"使用体感逼近Opus 4.5"——注意,是逼近,不是追平

但在很多场景下,GLM-5的表现已经让我觉得"不用每次都切回Opus了"。

价格差距:Opus每百万token 5/5/25,GLM编程订阅20元/月。

💭 最后的思考

从GLM-4.5到GLM-5,一年半时间:

  • 4.5 = 能用的初级程序员
  • 4.6 = 靠谱的中级程序员
  • 4.7 = 让人惊喜的高级程序员
  • GLM-5 = 架构师

Agentic Engineering时代,开源阵营终于有了自己的架构师。

如果你需要一句话生成漂亮网页,选别的也行。但如果你需要一个能接入Claude Code/OpenClaw帮你做工程的模型,GLM-5必须值得试试。

🚀 立即拼团薅羊毛:智谱 GLM Coding 订阅链接直达,20 + 编程工具无缝支持,越拼越划算,建议大家直接选择MAX模型,避免高峰期间被限流www.bigmodel.cn/glm-coding?…