GLM，Kimi，MiniMax怎么选？Win+C#开发横向对比！宣传起来个个都很牛逼。一到实战，各种问题。这就是国产

宣传起来个个都很牛逼。一到实战，各种问题。这就是国产 AI 模型在 Coding 中的真实状况。

那么如果硬要在这三个里面选一个，哪个会比较好呢？

那得看实测！

今天测试的主题是：使用 C# 开发一个 Windows 下的桌面程序。

需求很简单，开发一个电脑游戏🎮防沉迷功能，设置一个倒计时，时间到了自动关闭电脑上正在运行的游戏。

我发现大部分人不太爱看“最有魅力”的过程，我就直接上结果吧，然后直接上总结！

MiniMax M2.5：

设计界面稀烂，基本没法使用。

唯一一个主动设计了托盘而没有主界面的选手。

核心功能可用，但是倒计时显示糟糕。

GLM 4.7：

GLM 4.7 界面还可以，没啥大问题。功能也挺完善，尤其是，倒计时效果挺赞的。

设计感差一些，按钮和输入框这些基本上没有任何设计感，基本就是原始组件。

倒计时效果是好，但是有点大，可能会影响游戏体验。

在执行逻辑方面，他是采用了指定进程的方式，这种方式可靠性高，但是用户门槛也高。很多人是分不清楚什么游戏是什么进程的。

也是这种方式导致了一个问题，有些程序进程不显示，比如上面的 Boomerang，就找不到，也就是这个游戏它就无法结束。而双人成行和大表哥是可以的正常结束的。

排除进程的问题，核心功能运行正常，启动之后可以正常结束游戏。而且会有 30 秒倒计时，10 秒特殊效果。这部分整体不错。就是有一些交互细节可以优化。

Kimi K2.5：

Kimi 这次的界面有点崩，虽然是小清新，但是真的有点没法看。而且它的整个程序是无法使用的。它也是采用了先检测进程，再开始的设计。但是它检测不到任何游戏进程，所以也就没法开始了。

之前测试分析报告的时候，Kimi 表现还不错。但是 C# 开发这一部分，崩的有些厉害。属于界面，交互，功能全部拉跨的存在。所以同样的模型在不同领域还不一样。

作为参考，我也给一个 Claude Opus 4.6 的效果：

我之前说过了，Claude 是所有功能一次搞定，遵循少即是多，界面和交互都比较优秀。就是一次对话，就可以发布的效果。

我这毛病又犯了，我其实不应该发 Claude 的效果，容易拉仇恨。我先批评一下它，什么“垃圾”软件模型，虽然一轮对话就写好了，一点 bug 都没有，但是一把就消耗了 36% 的配额。

你看看人家，虽然活没干得特别好，但是工资便宜啊。

MiniMax 配额消耗情况：

只用了 10%，很快就重置满血了。

GLM 的消耗情况：

只用了 8%，比楼上的还要少！

Kimi 的消耗情况：

只用了 6%，比楼上的还要少~~！

这就是国产优势啊！

最后给三个国产模型在这一测试中的排名。

GLM 4.7 最好，MiniMax M2.5 居中，Kimi K2.5 垫底！

我只是抽测了一次，只测了这一个例子，但是也可以作为一个参考了。

天天都看人吹这个牛逼那个牛逼，也没见他们做实打实的对比测评。我至少实测了一把。

如果大家要选择开发桌面的 C# 应用，那么 GLM 4.7 好像还可以，GLM5肯定更好一些。

它的功能比较完善，界面也能看。稍微修改一下，应该是可以用了的。

其实，这里也有一个很有意思的点，最牛逼的那个 Anthropic 发报告说国产模型蒸馏它的模型，其中提到蒸馏最多的是 MiniMax，其次是 Kimi，最后是 DeepSeek，但是它却完全没有提到 GLM。

如果情况属实，那么就是说 GLM 真的是自己在搞，没有直接抄数据。

有的人说谁蒸馏最多，就应该选谁，我是完全相反的思路，谁自己在努力，我就支持谁。

另外我之前测试过它的 Coding Plan 是可以用在 OpenClaw 上的，而且不用特殊配置，我猜测它的规则是，如果有编码计划，就先消耗编码计划的配额，这一点很良心。

这个时候，应该上一波链接了，哈哈：

https://www.bigmodel.cn/glm-coding?ic=UXKQUXJKU3

相信我，我目前还没有接过任何广告！单纯凭自己的测试结果下结论。也许不全面，但是绝对真实！

最后我还是忍不住要贴一张Claude的效果图：

这是在上面提到的一轮开发基础上，做了修改的版本，已经可以直接发布使用了。

这TM才是高手！我天天自来水夸他，它鸟都不鸟我~~ ！

收工！