Kimi国内首个万亿参数开源模型K2模型

251 阅读5分钟

Kimi K2是目前国内唯一一个开源的万亿级参数的大模型。

现在kimi就有了三个首:

  • 首个联网
  • 首个支持超长文本(20万字超长文本)
  • 首个万亿级参数开源大模型

首先,来看看国内开源大模型的情况:

2023年3月清华智谱国内首发开源ChatGLM大模型

2023年8月阿里开源大模型Qwen(通义千问)

2025年1月深度求索开源DeepSeek大模型

2025年6月百度开源ERNIE(文心) 4.5系列大模型

2025年7月月之暗面开源Kimi K2大模型

。。。。

之前也有不少大佬说过自从deepseek开源后会带动国内AI领域开源的兴起,的确也如此。自从deepseek开源后,百度文心4.5也相继开源,再就是当下的Kimi K2。Kimi K2已经是直接开源权重+训练细节+推理脚本,后面大模型领域应该会走向更加开源的局面。

再来看看此次kimi带来了些什么?

Kimi是国内首个具备联网机制的AI大模型产品,在2023年推出来之后很多人就被它强大的搜索和分析能力所吸引,另外它还具备20万字超长文本的处理能力。

当然后面也不有不少说kimi的市场占比大多是因为它花了大量的金钱打广告,据统计每月近2.2亿用于打广告做推广。广告肯定是有的,但的确kimi能力也是非常优秀的,在当时很多AI常常胡说八道时独树一帜利用强大的联网能力实现AI回复准确率极高。

沉寂了近1年多的kimi在2025年7月11日发布了Kimi K2,官方有介绍Kimi K2是一款具备更强代码能力、更擅长通用Agent任务的MoE架构基础模型,总参数1T(万亿)。

我们来具体看看它有哪些亮点:

HuggingFace一周趋势

HuggingFace 本周的开源大模型趋势榜上,Kimi-K2-Instruct 强势占据首位,成为全球开发者社区最热门的开源模型之一。相对于排在第二位的大模型Kimi K2的热度值是它的3倍。

短短的5天时间就已经有大量的人下载了Kimi K2模型,其实现在很多人不只是停留在看热闹和简单的使用层面上,很多人已经真正把AI大模型使用到自己的产品里了。这才是拉开同龄人的关键,但想把AI大模型真正落到项目、落到简历,只跑通demo远远不够,光靠自学很容易卡在“会用不会改”上。

开源大模型数量

  • DeepSeek开源主模型+多个蒸馏版本共6款
  • 文心4.5全面开源从 0.3B 到 424B共10款模型。
  • Kimi K2此次开源了两个模型分别是:
    • Kimi-K2-Base:基础模型,对于希望完全控制微调和定制解决方案的研究人员和建设者来说,这是一个强大的开端。
    • Kimi-K2-Instruct:最适合插入式、通用聊天和代理体验的后训练模型。这是一个没有长期思考的反射级模型。

开源力度

Kimi K2此次是全链路开放,做成了迄今为止最激进的开源示范。权重、训练细节、商用许可、生态工具一次性全开放了。

开源协议

  • DeepSeek是开源在MIT协议下
  • 百度文心4.5开源在Apache 2.0协议下
  • Kimi K2是开源在MIT协议下

MIT 更加宽松,Apache 2.0 更规范。MIT是开发者的最爱,Apache是企业法务的刚需。因为Apache 2.0明确授予用户对代码中涉及的专利具有使用权。

模型性能

kimi开源也就5天的样子github上已经近5k+star了,国内的、国外的开发者都在追着研究它。

Kimi K2在自主编程、工具调用和数学推理三大能力维度的基准性能测试中取得优秀的表现,从官方的测试数据来看基本上Kimi K2的能力是仅此于claude的。

现在都在传Kimi K2这个旋转的星云效果,我们用官方给的提示词也来试试。

Prompt: Create a 3D particle galaxy with swirling nebulas, dynamic lighting. (创建一个 3D 粒子银河,包含旋转的星云和动态光照效果。)

可能是我的方式不对,又换成英文版的提示词,效果好像好一点,不过还是没达到官网提示的那种效果。

后面又多试了几次,效果还是不理想,黑屏了几次。有大佬说kimi把基础功能做到了极致,但高级点的功能还是不行。

KIMI or DeepSeek

Kimi K2 不是 DeepSeek V3 的“换皮版”,而是在DeepSeek V3的坚实肩膀上,把专家数、注意力头、训练数据、Agent强化学习的,如专家数量由 256 提升至 384。

Agent工具调用能力提升

Kimi K2 现已具备稳定的复杂指令解析能力,可将需求自动拆解为一系列格式规范、可直接执行的 ToolCall 结构。

你可以将其无缝接入 owl、Cline、RooCode 等 Agent/Coding 框架,完成复杂任务或自动化编码。

总结

作为国内首个开源的万亿参数大模型,Kimi K2 的发布又刷新了国内大模型开源的新高度。希望Kimi K2会像 DeepSeek 开源那样,再次掀起一轮大模型开源热潮。