为何中国能在开源 AI 浪潮中脱颖而出?

197 阅读4分钟

一提到“开源”,大家第一时间想到的可能就是 Apache 基金会,然后脑子里就会跳出一连串熟悉的名字:MySQL、Linux、Docker、Kubernetes……几乎清一色都是国外的项目,很多还是由美国的团队或公司主导的。长期以来,大家对开源的印象也确实有点固化,觉得“开源=欧美技术圈的事”。

但其实,这种看法已经越来越不全面了。

在中国,开源的种子早就已经悄悄种下,而且现在正在慢慢生根发芽,甚至可以说,已经有不少项目开始茁壮成长了。不光是个人开发者在玩开源,一些国内企业、社区组织也开始主动参与甚至主导一些重要的开源项目,影响力也在逐步扩大。

1、活跃的开源环境

看看下面一个开源排行榜top10里就是3个中国项目在里面,中国不缺乏开源精神的种子,所以在开源AI浪潮中中国出线也并不奇怪。

打开User这个纬度的排行榜,可以看到中国人(含华人)占比24% ,在全球占比非常的高。

并且中国的开源开发者还非常的活跃,另外国人对开源的关注性一直都很高。

2024年中国项目OpenRank排行榜,其中涵盖了多个技术领域,其中就包含大量人工智能项目。

此图来源于:hackmd.io

2、庞大的用户群体

中国绝对是AI使用的大户,人口基数大,并且上网人数多。

截至2024年12月,中国网民规模已达到11.08亿人,互联网普及率升至78.6%。而截至2024年底,全球互联网用户数量预计55亿人,也就是说中国这一庞大的网民群体占全球网民规模的比例超过20%。这是个什么概念:

第一、中国是全球互联网用户数量排名第一的国家;

第二、全球每5个就有1个是中国互联网用户。

这么恐怖的用户群体,看看能AI的关注度一直处于上升的趋势。

看看huggingface上排名前三的开源AI中就有2个是中国的开源项目,而deepseek-r1开源仅仅79天就冲到冲到了88.2k星

近9万星的DeepSeek热度不言而喻,就连国外开发者都追着研究。

另外可以发现访问github的流量中,中国和美国稳居前2,另外中国还有大量通过第三方网络进入github。按一些数据统计中国软件开发者数量已突破940万,也就是全球每三个开发者就有一个是中国人

3、海量的数据

中国拥有庞大的用户群体及海量的数据资源,据国家工业信息安全发展研发中心发布《全国数据资源调查报告(2023年)》显示,2023年,全国数据生产总量达32.85ZB(泽字节)。2023年我国非结构数据爆发式增长,内容创作、影像视听等非结构数据对我国数据总规模增长贡献较大。

据IDC数据显示2025年全球数据总量将达到175ZB。其中,中国的数据总量将达到48.6ZB,占全球数据总量的27.8%,也就是中国差不多占到三成。随着人工智能的发展数据还会显性出爆发式的增长。

4、利好政策

工信部在2025全球开发者先锋大会上表示,将加速完善开源生态体系,打造国际先进的人工智能开源社区。

另外政府也在鼓励国内高校和企业参与国内开源社区的建设,设立开源社区专项引导基金计划。