Minimax发布2.7了,它的编程能力提升了多少?

0 阅读4分钟

最近看到MiniMax m2.5和Opus的比较: juejin.cn/post/760875… ,自己用的时候也确实感觉这个模型差了不少,不过MiniMax现在发布了m2.7了,它的能力提升了多少呢?我用同样的提示词做了下测试。

太长可以直接看结论:

  1. m2.7在编程能力上的确有提升,但仍不如Opus 4.6。
  2. 多数情况下,通过SDD范式,可以显著提升模型产出质量

无限流冒险游戏

提示词:

请瞬间化身为一个复古文字冒险游戏引擎。用户输入“开始”,你需生成一个随机主题(如“火星殖民地生存”或“古代修仙”)。 ​ 娱乐要求:

  1. 每一步选择都要实时生成一张ASCII艺术插图(用字符拼成的画)来渲染场景氛围,不能重复。
  2. 游戏必须包含隐藏的“蝴蝶效应”逻辑,如果用户在第 3 步选择了“捡起石头”,在第 10 步遇到怪兽时必须体现出这个选择的后果。
  3. 若用户输入无理取闹的指令(如“我一拳打爆地球”),你需要用幽默的方式拒绝并引导回剧情,不能报错。

相比上一版首次生成就存在代码错误,2.7能正确生成代码,并且运行逻辑没有问题,是一个比较大的进步。

image.png

AI 五子棋对战

提示词

用一个 HTML 文件实现一个人机五子棋,要求:

  • 棋盘是15×15标准棋盘,有木纹质感
  • AI要足够聪明(至少能识破简单的活三、冲四,不能让人3步就赢)
  • 落子时有动画效果(石子从上方落下,有弹跳回弹)
  • 连成五子时有华丽的胜利特效(粒子烟花 + 连线高亮闪烁)
  • 支持悔棋功能
  • 有一个"AI思考中"的加载动画
  • 整体UI要精致,不能是毛坯房风格

2.7版本较上一版,棋盘生成更好,游戏逻辑也没有问题,但是棋子的位置仍然是有问题的。

image.png

不过我又用OpenSpec让它重新规划执行了一次,这次棋子位置终于对了,棋盘的质感也更好

image.png

赛博朋克版清明上河

提示词

请不要直接画图,而是编写一段 单个 HTML 文件 的代码,当我用浏览器打开它时,能看到一幅动态的、赛博朋克风格的《清明上河图》长卷。

华丽要求:

  1. 画面需要自动从右向左缓缓滚动。
  2. 必须包含至少 50 个动态元素:如闪烁的霓虹灯招牌、飞行的汽车、全息投影的广告、街头的机械义肢行人。
  3. 鼠标悬停在任意店铺上时,要弹出一个赛博风格的信息卡片(如“老王义体维修店 - 好评率 98%”)。

这次生成的内容还不如2.5版本的,全都是小黑人,而且店铺都卡在左边。

image.png

基于OpenSpec SDD重新生成,效果好多了

image.png

中国山水画

提示词

用纯 CSS(单个 HTML 文件,不允许用 JavaScript、SVG、Canvas、任何图片资源) 画一幅中国山水画。要求包含:远山、近山、瀑布流水、松树、亭台、云雾缭绕动效、 飞鸟。越写意越好,越像水墨越强。

2.7生成的水墨画明显比上一般更好,但还是差一点水墨渲染的感觉,飞鸟也太简单了。 image.png

SDD生成的飞鸟更生动,整体更有水墨和写意感,不过瀑布和山画的一言难尽。

image.png

诗词版黑客帝国代码雨

提示词:

用一个 HTML 文件实现黑客帝国经典代码雨效果,但有以下创意要求:

  • 下落的不是随机字符,而是中国古诗词(每列是一首完整的诗,从上往下逐字飘落)
  • 背景纯黑,文字渐变色(从亮绿到暗绿到消失)
  • 当鼠标划过某一列时,该列暂停并高亮显示完整诗句,旁边浮现诗人名和朝代
  • 至少包含20首不同的古诗
  • 整体流畅度要高,不能卡顿

文字依然糊在一起,而且没有按照顺序显示,但是效果其实挺好的,有雨幕的感觉 image.png

SDD下生成的效果反而更差,文字全堆在一起。就不贴图了。

本文参考自 甲维斯的 juejin.cn/post/760875… ,他文章里有多个模型的测试比对链接,欢迎访问。