全球3.5亿下载量破纪录！ Llama家族暴涨10倍，开源帝国掀AI革命诞生一年半，Llama 家族早已稳坐开源界头把交

【新智元导读】诞生一年半，Llama 家族早已稳坐开源界头把交椅。最新报告称，Llama 全球下载量近 3.5 亿，是去年同期的 10 倍。而模型开源让每个人最深体会是，token 价格一降再降。

Llama 一举成为世界开源的领头羊。

截至目前，Llama 模型在开源平台 HuggingFace 下载量近 3.5 亿。

Groq 的创始人表示，这也太疯狂了，想想 Linux 花了多长时间才达到这个数字？

官博介绍，这一数字，是去年同期的 10 倍。而且，仅在上个月，模型的下载量超 2000 万次。

2023 年 2 月，Llama 1 首次亮相，经过多次迭代，到现在已经过去了整整 18 个月。

而在这仅有的一年半里，Llama 已经从一个最先进的单体基础模型，发展成为，一个面向开发者的强大生态系统。

LeCun 还不忘给自家模型宣传一波，越来越多的大公司、小公司、初创公司、政府和非营利组织，正基于此开发新的产品和服务。

还有高校机构、研究人员和工程师每天都在改进 Llama，并提出新的用例。

另外，值得关注的一点是，自今年 5 月 Llama 3.1 发布之后，云服务商对模型 API token 调用需求，翻了一番还要多。

一些 Meta 最大的云服务提供商，从 2024 年 1 月到 7 月，Llama 的每月 token 量增长了 10 倍。

从微软云、英伟达、谷歌云等科技巨头，到 Groq、Databricks 等初创公司，全都支持 Llama 模型的使用。

老黄称，「Llama 深深地影响着最先进 AI 的进步」。

可见，Llama 正引领着开源之光。

Llama 开源，拉低 token 价格战

GPT-4 级别模型开源，最先带来的好处是，token 的价格不断下降。

AI 大牛吴恩达在 DeepLearning 的博客中，算了一笔账：

近期，OpenAI 官宣降价后，GPT-4o 的 token 成本，现在是每百万 token4 美元。（假设是 80% 输入和 20% 输入 token 混合率）

还记得，2023 年 3 月首发 GPT-4 时，每百万 token 的成本是 36 美元。

博客地址：www.deeplearning.ai/the-batch/i…

17 个月的时间，价格相当于每年下降了 79%（4/36 = (1 - p)^{17/12}）。

如你所见，token 价格正迅速下降！

而推动 token 价格不断下降的一个因素，便是开源模型（如 Llama 3.1）的发布。

这是因为，API 提供商（如 Anyscale、Fireworks、Together AI 初创公司，以及一些大型云服务商）并不需要担心赚回开发模型所需的成本，因此他们可以直接在价格、速度等其他因素上，开启竞争。

此外，一些芯片公司 Groq（快速生成 token 领先者）、Samba Nova（能以 114 token/s 速度运行 Llama 3.1 405B）、Cerebras（以 1800 token/s 速率运行 Llama 3.1 8B），以及英伟达、AMD、英特尔、高通等半导体巨头，在硬件上的创新，近一步拉低了模型价格。

Groq 发文介绍了，如今支持 Llama 模型的生态。

「到目前为止，Groq 已经使用 Llama 模型套件和自家 LPU Inference，每天向 40 多万开发人员提供 50 亿个免费 token」。

在构建用程序时，吴恩达发现，根据未来技术发展方向，进行设计是非常有用的，而非局限于当前水平。

基于多家软硬件公司的技术路线（改进半导体、更小的模型、推理架构中的算法创新），可以预见的是，token 价格还将持续下降。

这意味着，即便你构建的智能体工作流看起来成本太高，而随着 token 价格不断下降，或许在某个时间，这套方案在未来也变得经济可行。

假设你创建了一个 APP 帮助人类，可每秒连续输出 100 个 token。那如果百万 token 4 美元，每小时只花费 1.44 美元。

这远远低于美国，以及许多其他国家最低工资标准。

Meta 挑战 ChatGPT 赢得数百万用户

小扎希望，到今年年底，让 Meta AI 成为全球使用量最多的 AI 助手，超越 OpenAI 的 ChatGPT。

目前，这一切正朝着他的目标，取得了进展。

据内部 2 位员工透露，8 月初，Meta AI（2023 年 9 月发布）在发布不到一年时间里，收揽了至少 4 亿月活跃用户和 4000 万日活跃用户。

这些数字从侧面反映了，超 30 亿用户的 Meta，每天至少使用 Meta 旗下的一款应用中的 AI 助手。

此外还包括，通过 Meta AI 专属网站，以及 Ray-Ban 智能眼镜，也收获了不少用户。

庞大的用户群，成为大型科技公司优势，希望从 ChatGPT 中夺取一部分市场份额和关注度。

其实，谷歌也向数十亿用户推广了对话式 AI——Gemini，但力度却不如 Meta。

但一些使用 Meta 应用程序的人，在 Facebook、Reddit、X 上，抱怨 Meta 过于激进地推广 AI 助手，比如在其 APP 的键盘上添加搜索按钮。

有的人还出了一个关闭 Meta AI 对话的教程。

出于对用户参与度的担忧，Meta 员工可能会不定期讨论的一个问题是，是否有些用户无意间使用了 Meta AI。

8 月初使用数据显示，大约 10% 的月活跃用户，每天使用助手来回答问题、生成图像和执行其他任务。

而这一比例远低于 Meta 的其他应用程序。

Meta 此前 2 月报告称，80% 的月活跃用户每天至少使用一款自家的应用。

这些数字表明，Meta AI 已经是 ChatGPT 强有力的竞争者之一。

2022 年 11 月，ChatGPT 首次推出。截至目前，每周有超 2 亿人使用。鉴于最近的使用数据，Meta AI 可能相距不远。

与 Meta AI 不同，ChatGPT 也是一项盈利的业务模型。

数百万用户每月需要支付 20 美元，成为 ChatGPT Plus 用户，才能用上最先进模型撰写、编程、答问的能力。

数据显示，ChatGPT 订阅收入，每年大约高达 20 亿美元。

Meta 已在今年投入高达 400 亿美金数据中心和其他基础设施。

而 Meta AI 被视为，未来公司获得这些巨额投资回报的关键部分，主要用于开发这一产品的背后大模型 Llama。

虽有报道曝出，Meta 正推出一个付费版的高级人工智能助手。

去年 9 月，Meta 刚刚推出 AI 助手时，人们最初只能通过 Instagram、WhatsApp 或 Messenger 上的直接消息与 Meta AI 聊天。

今年，Meta 开始在各种应用中，让其变得更加显眼、容易访问。

4 月，他们将 Meta AI 添加到其应用程序的搜索栏和信息流中，并为其推出了独立网站 meta.ai。

同月，Meta 还推出了一个新版本的 AI 助手，该版本能够识别和解析图像，并在其 Ray-Ban 智能眼镜中广泛应用。

目前，该助手在 Meta 的应用程序中可用的语言有 8 种，并在 22 个国家提供，同时在美国和加拿大的智能眼镜中提供英语版本。

开源 AI 如火如荼

开源 AI 技术正在迅速发展，推动着生成式 AI 的重大创新。通过 GitHub 和 Hugging Face 等可访问的研究和平台，社区已经启动了取得突破性成果的项目。

生态系统：稳步增长，走出泡沫化的底谷期（Trough of Disillusionment）

自 2023 年第一季度的温和增长以来，开发者的兴趣已经增长并稳定下来，进入了「稳步爬升的光明期」（Slope of Enlightenment）——价值驱动的创新在此增长。

2024 年，开源 AI 中严肃的开发者参与（即 GitHub 贡献者）仍在继续增加。

市场分析：开发工具仍是热门，训练和监督势头正旺

- 开源 AI 产品初创企业数量显著增加

2024 年，参与开源 AI 的参与者数量激增，新的参与者如 Neum AI 和 Patronus AI 进入了这一领域，而像 Vian AI 这样的老牌参与者也为其用户提供了开源工具包。

- 开发工具仍然热门；培训和监控工具竞争加剧

大多数初创企业仍专注于生成式 AI 的开发工具，这对于构建、部署和管理应用程序至关重要。

然而，围绕模型训练和监督用例的初创企业活动有所增加，这表明可能会向在小众数据上微调模型和增强 AI 治理的方向转变。

在开源模型领域，领先者开始显现，开发的新模型较少，更多的重点放在来自 Mistral 和 Meta 等公司的改进和更高效的版本上。

- 开源开发正在缩小与闭源解决方案的差距

开源使得研究更具成本效益和可访问性，促进了来自多元创作者的创新，并且法律限制较少。据统计，有 41% 的企业用户倾向于选择开源来满足生成式 AI 的需求。

融资环境：融资步伐加快，规模更大、后期交易增多

过去两年，开源 AI 领域已完成 60 多笔交易，总融资额超过 130 亿美元。这些交易中有超过 45% 属于 A 轮及以上的融资，表明对增长阶段投资的强烈关注。

Deci AI 被英伟达以 3 亿美元收购
Scale AI 完成了 10 亿美元的 F 轮融资
Mistral AI 完成了 6.4 亿美元的 B 轮融资
Together AI 完成了 1.06 亿美元的 A 轮融资

在开源 AI 领域中，模型训练和开发工具是获得资金最多的细分领域（不包括 Mistral 和 Databricks），占总融资的 60%。

其中，英伟达参与了 8 笔交易（包括 Scale AI、Mistral AI、Together AI）。

基础模型：性能差距已缩小

如今，开源和闭源模型之间的基准差距现在比以往任何时候都要小——Meta Llama 和 Mistral 在 MMLU 上的表现几乎与 GPT-4o 相同。

其他开源模型，如 Qwen 和 Yi，也在性能上快速赶上。

为了解决现有评估（如 Elo 和 MMLU）的局限性，Hugging Face 于 2024 年 6 月正式推出了专注于复杂任务的开源 LLM 排行榜——Open-LLM-Leaderboard。

在过去的 6 个月中，随着新竞争者的出现，开源 AI 的格局发生了显著变化。

经过大量数据预训练的 Qwen，于 2024 年 6 月在 Huggingface Traction 上获得了最高的下载量。

Github：Huggingface、MindsDB 和 Roboflow 非常火爆

GitHub 的 stars 是项目在 GitHub 上受欢迎程度的直接指标。

AutoGPT 和 ModularML 的 Mojo 在 2023 年引领了 GitHub 热度——自那时以来，多个仓库已经获得了显著的进展。

LeRobot 提供基于 PyTorch 的真实世界机器人模型、数据集和工具，旨在使机器人技术更易于访问。它具有最先进的模仿学习和强化学习方法，提供预训练模型、人类收集的数据集和模拟环境。

由英伟达支持的 MindsDB 是一个使用企业数据构建 AI 模型的平台。MindsDB 简化了数据源和 AI/ML 工具之间的连接，自动化工作流程以创建定制的 AI 系统。

参考资料：

ai.meta.com/blog/llama-…

x.com/ylecun/stat…

www.theinformation.com/articles/me…

synaptic.com/resources/o…

全球3.5亿下载量破纪录！ Llama家族暴涨10倍，开源帝国掀AI革命

**【新智元导读】**诞生一年半，Llama 家族早已稳坐开源界头把交椅。最新报告称，Llama 全球下载量近 3.5 亿，是去年同期的 10 倍。而模型开源让每个人最深体会是，token 价格一降再降。