PPIO上线GLM-5.1:面向8小时级长程任务的开源SOTA模型

0 阅读1分钟

今天,PPIO 上线 GLM-5.1。

GLM-5.1 是智谱新一代的旗舰级智能体工程模型,其编码能力比上一代产品显著增强。GLM-5.1 在 SWE-Bench Pro 测试中取得了最先进的性能,并在 NL2Repo(代码库生成)和 Terminal-Bench 2.0(真实终端任务)测试中大幅领先于 GLM-5。

但最有意义的飞跃不仅仅体现在首次运行的表现上。之前的模型——包括 GLM-5——往往过早地耗尽了其性能储备:运用熟悉的技巧来快速取得初步进展,然后便停滞不前。给予模型更多的时间也无济于事。

相比之下,GLM-5.1 的设计目标是在更长的时间跨度内保持对智能体任务的有效性。该模型能够更准确地处理模糊问题,并在更长的运行时间内保持高效,能够分解复杂问题,运行实验,解读结果,并精准地识别障碍。通过反复迭代,GLM-5.1 不断回顾其推理过程并调整策略,从而在数百轮迭代和数千次工具调用中持续优化。运行时间越长,结果越好。

目前,该模型已上线 PPIO 模型广场,您可以在线试用该模型或通过 API 快速集成。 地址:ppio.com/model/zai-o…

最后,PPIO 准备了一份 token 福利:

  1. 如果你是 PPIO 新用户,关注公众号并在主页私信“GLM-5.1”,注册并完成实名认证后可获得 50 元 token 代金券。数量 10 份,先到先得!

  2. 如果你是 PPIO 老用户,可参与 PPIO 的邀请返利活动。邀请朋友注册 PPIO ,最高享受 15% 的好友充值返利,单笔充值金额上不封顶,详情可到“PPIO控制台-我的-邀请返利”活动页查看。