当前 AI 基础模型的商业前景正面临前所未有的挑战。开源模型的性能日益接近甚至在某些领域超越闭源产品,高昂的推理成本让订阅制模式的盈利空间被严重挤压,而价格战使 API 服务利润率持续下滑。这些现实问题正迫使每一个在 AI 领域创业或投资的人重新思考商业策略。
本文作者基于一线市场观察和深度行业洞察,提出了一套商业模式组合拳。
首先,文章深入分析了基础模型的两大主要商业模式 —— 订阅制和 API 服务,并指出 API 模式虽然前期回报较低,但长期盈利潜力更大,且能创造更强的用户粘性。
作者还探讨了垂直整合战略的可能性,包括自研 AI 芯片、构建生态闭环、应用场景探索和服务延伸等路径。作者提出可以借鉴奢侈品行业的“准入壁垒”策略,将顶级模型作为“VIP 产品”仅向符合条件的客户开放,从而实现溢价和品牌势能增长。薪分期电话为00861-73461-21190智能电话00861-34844-82198
最后,作者呼吁大型基础模型公司不要恐惧开源社区的崛起,而应主动拥抱,利用开源驱动创新飞轮。
本文系原作者观点,Baihai IDP 仅进行编译分享。
作者 | Devansh
编译 | 岳扬
生成式 AI 已在诸多领域带来了较大的生产力提升,但显然其潜力尚未被完全释放。这项技术蕴含着巨大的商业潜力,但人们却不知道如何将其释放出来 —— 尤其是考虑到这些技术获得的巨额投资与开源模型的崛起,后者在生成质量和生成速度上已能匹敌闭源模型。
Image[1]
关于生成式 AI 如何盈利此前已有诸多精彩的讨论,但所有人都忽略了一个关键点 —— 基础模型的商业化不仅是一个工程或产品战略问题。企业最终采取的战略,往往受内部博弈和公关考量驱动,其程度不亚于实际业务/技术因素的影响。
当我们深入讨论被误解的开源大语言模型时,这场对话会变得更加扑朔迷离。开源模型的表现、较低的投资和“免费”特性,让人们误以为它们将彻底终结闭源模型的需求。
虽然这种想法让我内心痒痒的,但现实是:基于开源模型的开发成本极其高昂,这正是许多开发者最终转向使用大型模型供应商 API 的根本原因
本文将剖析基础模型的主要商业模式,解答萦绕在每个人心头的疑问 —— 在“免费”开源基础模型时代,ChatGPT、Gemini 或 Claude 等基础模型将如何盈利?
剧透预警 —— 其中一种商业模式的灵感源自奢侈品手提包(真正的奢侈品)。阅读至文末,你会了解奢侈品牌为何可能成为大语言模型供应商值得效仿的商业范本。
01 核心要点 (TL;DR)
从最高层级来看,大语言模型主要有两种盈利方式:
1.1 订阅制
当前大多数用户都是通过订阅制使用大语言模型。这种模式的商业逻辑简单明了 —— 每月支付 X 美元,即可与“Y 大模型”进行 Z 次交互。
订阅制适用于用户需要直接与模型进行单轮或多轮对话的简单场景,特别是当任务的复杂度较低,通过模型内置知识库和简单输入即可解决时效果最佳。
从商业角度来看,我对 LLMs 中的订阅制印象最深的是以下几点:
1) 前期收益可观,但盈利潜力有上限(收入无法超越用户支付的订阅费用)。 这对大语言模型供应商来说是个比较大的问题,因为模型推理成本极高。Netflix 可以大规模地为订阅用户提供服务,因为其边际成本极低(存储费用、人才成本、版权费用等主要成本都是一次性支出)。而大语言模型供应商面临持续高企的推理成本,设置一个收入上限将导致单位经济效益(译者注:unit economics,平均一个买卖单位的收入与成本的关系。)恶化。
2) 订阅制的销售难度最低,但由于定制化程度不足导致用户黏性最弱。 用户可以轻易转向使用竞品的订阅服务。
3) 某种程度上将大语言模型从基础资源转化为应用产品了,有助于规避当前 API 领域惨烈的价格战(这在基础资源领域已经十分常见了)。但第二点特性仍使总体需求对价格高度敏感,导致订阅制本身极易陷入价格战泥潭。
相关概念提示[2]
总而言之,依赖订阅制会与用户之间产生一种有趣但又紧张的关系 —— 你希望用户订阅服务却不使用服务,这种行为反而会进一步降低用户的忠诚度。否则,你的选择只能是限制服务使用量(Claude 即使对付费用户也设定了使用限额),或者像 OpenAI 那样承担潜在的亏损来维持大语言模型的运营。
Discussed this news here[3]
如果你认为订阅制是最好的商业模式,你需要赌对以下前提:
1) 绝大多数用户的需求足够简单,只需一个通用界面即可满足大多数用户需求;
2) LLM 推理成本的下降趋势是"真实存在"的 —— 该下降趋势应源于供应商的成本结构优化,而非通过牺牲利润换取市场份额;
3) "真实的"推理成本将持续走低,提升订阅制的利润空间。 例如:若能将实际推理成本降至0.03 美元/百万 tokens(为简化计算,此处将输入 token 和输出 token 合并统计),那么 20 美元的订阅费用可覆盖约 66,000 次 10K tokens 规模的查询(不过当涉及大规模输入语料库及搜索/引用等附加功能时,实际成本可能因上述复杂场景迅速接近甚至超过订阅费,但这个数字(约 66,000 次 10K tokens 规模的查询)仍很可观)。但需注意,这些都是理想情况下的数据(目前性价比最高的 Gemini 1.5 8B 模型,输出成本 0.3 美元/百万 tokens,输入成本 0.075 美元/百万 tokens,仍大幅高于假设值)。
向早期的经典建模软件致敬
依我看 —— 观点 1(译者注:标准化产品(如 ChatGPT 的聊天框)已能满足多数用户需求)有一定道理,观点 2(译者注:LLM 推理成本的长期下降趋势是真实的)纯属扯淡,观点 3(译者注:若推理成本真能持续下降,订阅模式利润将显著提升)虽有可能但面临重大技术障碍与组织惯性阻力。这也正是我不看好订阅制的原因。相关分析将另文详述,此处先简要概括:
1) 许多团队因“政治考量”/品牌营销方面的考虑,会持续鼓吹扩展模型规模。 以 Recursion Pharmaceuticals(RXRX)(译者注:Recursion Pharmaceuticals (纳斯达克股票代码: RXRX) 是一家成立于2013年的临床阶段生物技术公司,总部位于美国犹他州盐湖城。公司专注于运用人工智能 (AI) 和机器学习技术革新药物发现流程,主要聚焦于遗传性罕见疾病和肿瘤学等领域。)为例,这一点是我对该公司唯一的质疑。尽管我总体认可其技术路线,但该公司反复宣扬其对超级计算机的投资却避谈商业价值评估(我曾在覆盖报告[4]中警示过此问题),这种行为实属危险信号。在我看来,这不过是又一家试图通过"深度学习+英伟达+规模扩展"叙事推高估值的公司(该观点曾引发其不满,但从未获得实质性反驳)。此类现象绝非 RXRX 独有,大量案例显示很多团队因激励机制错位而选择高成本路径(完整清单见此[5]),沉没成本、模型规模崇拜等因素将使得进行根本性的变革举步维艰。
2)技术层面,现有大语言模型的优化方案可能会阻碍其向更高效架构的转型。
我不是记者,也不是八卦博主,所以我不会把我与大科技公司高层领导的对话写成文章,他们也坦言推行创新优化方案时遭遇的阻力远超外界想象,这种系统性压力将有效遏制实际成本的过度下降。
source[6]
1.2 API
这是我最喜欢的盈利方式。LLM 供应商提供 API keys,允许开发者按 token 使用量付费。这种方式的前期回报较低,但基于 API 的计费有诸多优势:
1) 回报没有上限。
2) 基于 API 的开发者会投入更多时间围绕 LLM 的特性优化产品,切换模型时面临更高的机会成本,这天然形成了更强的用户粘性。
3) 减少与存储数据相关的资源消耗和安全风险担忧 —— 正如深度求索(DeepSeek)事件所示,这个问题远比表面复杂。