GLM,Kimi,MiniMax怎么选?Win+C#开发横向对比!

0 阅读4分钟

宣传起来个个都很牛逼。一到实战,各种问题。这就是国产 AI 模型在 Coding 中的真实状况。

那么如果硬要在这三个里面选一个,哪个会比较好呢?

那得看实测!

今天测试的主题是:使用 C# 开发一个 Windows 下的桌面程序

需求很简单,开发一个电脑游戏🎮防沉迷功能,设置一个倒计时,时间到了自动关闭电脑上正在运行的游戏。

我发现大部分人不太爱看“最有魅力”的过程,我就直接上结果吧,然后直接上总结!

MiniMax M2.5:

设计界面稀烂,基本没法使用。

唯一一个主动设计了托盘而没有主界面的选手。

核心功能可用,但是倒计时显示糟糕。

GLM 4.7:

GLM 4.7 界面还可以,没啥大问题。功能也挺完善,尤其是,倒计时效果挺赞的。

设计感差一些,按钮和输入框这些基本上没有任何设计感,基本就是原始组件。

倒计时效果是好,但是有点大,可能会影响游戏体验。

在执行逻辑方面,他是采用了指定进程的方式,这种方式可靠性高,但是用户门槛也高。很多人是分不清楚什么游戏是什么进程的。

也是这种方式导致了一个问题,有些程序进程不显示,比如上面的 Boomerang,就找不到,也就是这个游戏它就无法结束。而双人成行和大表哥是可以的正常结束的。

排除进程的问题,核心功能运行正常,启动之后可以正常结束游戏。而且会有 30 秒倒计时,10 秒特殊效果。这部分整体不错。就是有一些交互细节可以优化。

Kimi K2.5:

Kimi 这次的界面有点崩,虽然是小清新,但是真的有点没法看。而且它的整个程序是无法使用的。它也是采用了先检测进程,再开始的设计。但是它检测不到任何游戏进程,所以也就没法开始了。

之前测试分析报告的时候,Kimi 表现还不错。但是 C# 开发这一部分,崩的有些厉害。属于界面,交互,功能全部拉跨的存在。 所以同样的模型在不同领域还不一样。

作为参考,我也给一个 Claude Opus 4.6 的效果:

我之前说过了,Claude 是所有功能一次搞定,遵循少即是多,界面和交互都比较优秀。就是一次对话,就可以发布的效果。

我这毛病又犯了,我其实不应该发 Claude 的效果,容易拉仇恨。我先批评一下它,什么“垃圾”软件模型,虽然一轮对话就写好了,一点 bug 都没有,但是一把就消耗了 36% 的配额。

你看看人家,虽然活没干得特别好,但是工资便宜啊。

MiniMax 配额消耗情况:

只用了 10%,很快就重置满血了。

GLM 的消耗情况:

只用了 8%,比楼上的还要少!

Kimi 的消耗情况:

只用了 6%,比楼上的还要少~~!

这就是国产优势啊!

最后给三个国产模型在这一测试中的排名。

GLM 4.7 最好,MiniMax M2.5 居中,Kimi K2.5 垫底!

我只是抽测了一次,只测了这一个例子,但是也可以作为一个参考了。

天天都看人吹这个牛逼那个牛逼,也没见他们做实打实的对比测评。我至少实测了一把。

如果大家要选择开发桌面的 C# 应用,那么 GLM 4.7 好像还可以,GLM5肯定更好一些。

它的功能比较完善,界面也能看。稍微修改一下,应该是可以用了的。

其实,这里也有一个很有意思的点,最牛逼的那个 Anthropic 发报告说国产模型蒸馏它的模型,其中提到蒸馏最多的是 MiniMax,其次是 Kimi,最后是 DeepSeek,但是它却完全没有提到 GLM。

如果情况属实,那么就是说 GLM 真的是自己在搞,没有直接抄数据。

有的人说谁蒸馏最多,就应该选谁,我是完全相反的思路,谁自己在努力,我就支持谁。

另外我之前测试过它的 Coding Plan 是可以用在 OpenClaw 上的,而且不用特殊配置,我猜测它的规则是,如果有编码计划,就先消耗编码计划的配额,这一点很良心。

这个时候,应该上一波链接了,哈哈:

https://www.bigmodel.cn/glm-coding?ic=UXKQUXJKU3

相信我,我目前还没有接过任何广告!单纯凭自己的测试结果下结论。也许不全面,但是绝对真实!

最后我还是忍不住要贴一张Claude的效果图:

这是在上面提到的一轮开发基础上,做了修改的版本,已经可以直接发布使用了。

这TM才是高手!我天天自来水夸他,它鸟都不鸟我~~ !

收工!