(1)近日,关于大模型行业的“定价权VS消耗战”引发热议。随着中美AI竞赛加剧和推理需求激增,算力荒成为悬在行业头顶的达摩克利斯之剑。行业内部正在形成两股截然不同的力量:一方是智谱、Kimi等企业试图通过降价换规模,另一方是小米等端侧巨头死磕降耗。
(2)降价派逻辑:降价派认为,算力成本是阻碍AI普及的根本瓶颈。他们通过商业补贴或底层硬件创新,将Token价格压至极低,甚至免费。智谱、Kimi、MiniMax等通过API价格战吸引开发者,赌的是规模效应和数据飞轮。更有Taalas等新锐芯片公司试图在硅片层面直接硬编码模型,追求成百上千倍的效率提升。
(3)降耗派逻辑:与之相对,小米MiMo团队负责人罗福莉指出,单纯降价无法解决端侧设备的算力荒。手机、汽车等设备受限于电池容量和散热空间,必须研发省Token的底层框架。降耗派通过改进注意力机制、引入线性复杂度模型和优化Token设计,力求在保持性能的同时极大降低能耗。
(4)商业博弈:降价派的护城河在于网络效应和极高转换成本,他们希望把AI算力变成类似电力的基础设施。降耗派的护城河则在于软硬一体的闭环体验,控制用户隐私和极低延迟响应。两者在当前窗口期竞争激烈,但未来可能走向云端协同:复杂任务交由降价派的廉价云算力处理,个人隐私和低延迟任务交由降耗派的端侧模型完成。
(5)结语:从历史经验看,这场分水岭之争类似于PC时代的服务器与芯片之争,或者智能手机初期的流量补贴与硬件体验之争。无论是以亏损换规模的降价派,还是以技术打磨基石的降耗派,最终目标都是让AI真正走向大众。资本的选择和市场的演进,将决定谁能在AI下半场构筑起更深的护城河。
(6)行业观察:业内人士指出,当前的算力竞争不仅是技术的较量,更是资本与商业模式的博弈。降价派需要巨额资金支撑其低价策略,风险在于长期的现金流压力;而降耗派则依赖于硬件迭代速度和生态布局,挑战在于如何在有限的算力窗口内提供足够的智能能力。随着监管政策趋严和用户隐私保护意识提升,端侧算力的安全性和合规性将成为下一轮竞争的焦点。未来,可能出现“算力即服务”的新形态,即企业通过租赁算力资源而非购买硬件来应对波动,进一步模糊云端与端侧的界限。
行业预测显示,算力效率的提升将决定AI生态的未来格局。这是技术与商业的终极博弈。