哪个大模型最好用--此刻我们正经历大模型厂商的战争

7 阅读3分钟

如果你搜索关键字看到的这篇文章,那说明你也从模型发展中嗅到了未来。

最近你会发现一个很明显的变化:不少国外的大模型开始“免费”生成代码,而且还支持把生成结果一键上传到 GitHub。表面上是福利,背后其实是一种很典型的逻辑:数据越多 → 模型越好用 → 更多人来用 → 数据更多

这里面有个关键点可以用一句话概括:选择即投票

1. “选择即投票”:你用不用,就是在给它打分

当你让 AI 写一段代码,你接下来会做三件事之一:

  • 直接用它,并提交到仓库:相当于投了“赞成票”
  • 改一改再提交:相当于给了“更好的参考答案”
  • 不用这段:相当于投了“反对票”

这和谷歌的人机验证很像:让你去选“红绿灯/斑马线”那几张图。你以为是在证明自己是人,但你点的那些选择,本身也会反过来帮助系统变得更聪明。

放到写代码这件事上也是一样:当大量人把 AI 生成的代码改完、用上、提交到 GitHub,本质上就是在用真实场景做“筛选”和“标注”。

2. 用 GitHub 占比看“模型实力”:50% 可能会出现“默认模型”

如果按“选择即投票”的思路继续推,一个挺直观的指标就是:某个模型生成的代码,在 GitHub 全部新增代码里占了多大比例

比例越高,说明两件事:

  • 它被更多人用在真实项目里(入口更强)
  • 它能拿到更多“被人类选择过”的反馈(训练更有优势)

而当这个比例接近、甚至超过 50% 的时候,事情就会变得很不一样:大家会越来越习惯某种写法、某些库、某些组织方式。久而久之,它就可能变成一种“默认的写代码方式”,也就是会出现一个默认模型——不是官方宣布的,而是被大量使用“自然推出来”的。

3. 为什么谷歌免费 Gemini 并支持一键上传 GitHub 很高明

再回头看谷歌的策略(比如 Gemini 免费、并且支持一键上传 GitHub),就很好理解了。

GitHub 是微软的地盘,但“代码从哪里来”更关键:如果越来越多代码是由 Gemini 生成、被人类挑选后提交上去,那么谷歌其实是在一个全球最大的代码池里,持续地制造“对自己有利的投票”和反馈,像是借鸡生蛋。

所以这不仅是“免费竞争”,更像是在抢一个长期位置:谁能更早、更大规模地进入开发者工作流,谁就更可能在未来拿到更多真实数据,进而把模型越滚越强。

4. 一个不太舒服但绕不过去的结论

我们在享受免费工具的时候,也选择帮它变强:每一次复制粘贴、每一次修改、每一次提交,都会变成它学习的一部分。

从这个角度看,谷歌的一键上传策略,本质上是一场关于“未来代码基因”的争夺:当 AI 生成的代码在 GitHub 上占据主导地位时,谁的模型是那个“最大贡献者”,谁就掌握了未来软件世界的底层规则。

原文