小红花大语言模型(LLM)排行榜(2025年3月):DeepSeek即将登顶

200 阅读4分钟

小红花大语言模型(LLM)排行榜(2025年3月):DeepSeek即将登顶

小红花技术领袖俱乐部旗下内容平台「小红花·文摘」(xhh.club/)发布2025年3月的大语言模型(LLM)排行榜,前三名是GPT、DeepSeek和Llama

本榜单仅是对各种大语言模型(LLM)在当下的流行度(热门程度,或被采用/使用程度)进行排名,与它们的优缺点无关,萝卜青菜,各有所爱,本排行榜与它们的功能、性能、优劣等无关。

本文包括排行榜详情,排行依据及统计说明,解释与其它排行榜的不同之处,等。

3月标题:DeepSeek即将登顶

首先来看榜单的前20名(以首名为100分计算其它项的相对分后排名):

名次大语言模型(LLM)流行度
1GPT100.00
2DeepSeek93.69
3Llama47.91
4Gemini43.24
5o132.03
6Claude30.21
7千问18.75
8文心16.02
9豆包11.83
10Grok9.46
11o36.96
12Phi6.10
13GLM3.42
14混元3.28
15Mistral3.06
16Gemma2.70
17Moonshot2.69
18盘古2.21
19Cohere1.63
20讯飞星火1.44

本热DeepSeek继续大热,越来越热,流行度已经拿到了93.69得分,比上月的70.34足足多了23分还多,增长像坐了火箭,而OpenAI新发布模型已经“不拼推理推情感”了,感觉下个月可能会迎来DeepSeek登顶的历史时刻!

然后榜单上的其它大语言模型排序基本上平静如水,只有 Grok 3 的发布把 Grok 往前推了一位,进入第 10 名。而讯飞星火首次冲进前 20 名,虽然是吊车尾,也是一个新的成就。它挤下来的 MiniMax 刚令人嘘唏。

小红花大语言模型(LLM)排行榜(2025年3月):DeepSeek即将登顶

以上是本月排行榜的全景图,往后排列的是:Granite、Nemotron、MiniMax、Orion、Amazon Titan、InternLM、Yi、MiniCPM、BaiChuan、Pixtral、日日新大模型、Alpaca、PaLM、Vicuna、Molmo、天工大模型、WizardLM、BlueLM、Prithvi WXC、PowerLM、PowerMOE、ChipNemo、Weaver、Tulu、Guanaco、TigerBot,等

排行依据和统计说明

排行依据

小红花技术领袖俱乐部旗下内容平台「小红花·文摘」聚合全球(以中文、英文为主,基于AI进行摘要和翻译)开发者博客的准实时内容(延迟通常不超过1小时),目前每月内容数量接近1万篇,绝大部分内容为编程相关的硬核文章,通过分析文章涉及的大语言模型(LLM),并据此进行统计,作为一个流行度指标榜单是可信的。

统计说明

1、
整体而言,小红花系列排行榜就是统计时间范围之内各主题相关的内容数量,在乘以针对不同制定的系数之后,相关内容在总数量上的占比及排行。

2、
考虑到小红花系列排行榜刚刚开始编制,未来可能会有比较大的调整和修改,暂时不会公开算法和系数。

3、
为确保尽可能地统计不同大语言模型(LLM),我们对它们的别名也进行了归一化处理,如GLM包括了GLM2、GLM3等。

特此说明。

与其它排行榜的不同之处

1、
其它榜单大多统计互联网上不同云厂商相关内容的总量,而小红花系列排行榜采用的数据是3年维度内的中短期内容为基数,1个月维度内的新内容为参照,能够快速反映流行度变化。

2、
因为小红花系列排行榜大约有一半数据源是中文的,所以会和基于英文内容的统计有比较大的差异,但经由我们和国内开发者沟通,小红花系列排行榜和我们的「体感」较为一致。

小结

整体来说,一个中文内容占比较大的排行榜,对项目的技术方案选型是有参考意义的,这是小红花系列排行榜的动力之源,也是以后继续编制的意义所在。接下来我们将在「小红花·文摘」开辟排行榜栏目以便发布相关信息和内容,同时也会发布在我们公众号,敬请关注。

鸣谢

小红花系列排行榜得到了广大的认可和支持,很多自媒体公众号参与了上一月的内容转载,特此鸣谢(以下排名不分先后):

  • • 东波哥说
  • • 白鲸技术栈
  • • TechParty
  • • Tap4 AI导航

现在继续诚征公众号转载本文,微信公众号运营者可以直接使用快捷转载功能转发,或者留言转发+公众号号ID,我们将在后台为您开启白名单。其它平台的自媒体账号可以直接复制内容发布,也欢迎视频号等其它形式的自媒体依据本榜进行二次创作。

感谢大家支持!