前言
去年九月红杉资本发布了生成式AI第二幕的报告。技术掀起了生成式人工智能的第一幕,我们发现了一种新的工具“基础模型”并释放了一些新奇的应用场景,但它们只是这种炫酷技术的小试牛刀。现在以用户需求为中心的第二次变革正拉开序幕。“生成式 AI 第二幕”是对第一幕的思维迭代,并从资本、市场以及生态角度重新思考生生成式AI。
报告原文链接:www.sequoiacap.com/article/gen…
总体解读
- 许多人工智能公司根本没有产品与市场的契合度或可持续的竞争优势,人工智能生态系统的整体热情是不可持续的。
- 市场已经开始进入第二幕来自于用户,通过端到端的方式解决用户的问题。更倾向于基础模型作为方案的一部分来解决问题,而不是全部。
- 报告对生成式AI的市场分布以及基础工具和计算供应商进行了梳理。
需要修正的一些观点
- AI相关技术发展太快,以前预料某些技术至少需要十年,但现在看发展迅速。
- 没有想到算力比用户需求更加紧迫。例如:出现了支付费用跳过使用环节的商业模式。
- 基础模型提供商应该和应用层分离,但目前没有看到这个趋势,相反最成功的面向用户的应用程序已经垂直整合。
- 市场进程更加激烈以及企业反映迅速放大了竞争热度。表现为客户之间设置基础模型不可知。
- 护城河在客户,而不是数据。最好的生成式人工智能公司可以通过数据飞轮产生可持续的竞争优势:更多的使用→更多的数据→更好的模型→更多的使用。虽然这在某种程度上是正确的,特别是在具有非常专业和难以获得数据的领域,但“数据护城河”的基础是不稳固的:应用程序公司生成的数据不会创造不可逾越的护城河,下一代基础模型很可能会抹去初创公司产生的任何数据护城河。相反,工作流程和用户网络似乎正在创造更持久的竞争优势来源。
预测相对准确的一些观点
- 生成式AI非常火爆。
- 第一个杀手级应用诞生。ChatGPT是最快达到一亿 MAU 的应用程序,而且它在短短 6 周内就有机地做到了这一点。相比之下,Instagram花了2.5年,WhatsApp花了3.5年,YouTube和Facebook花了4年才达到这一用户需求水平。同时另外一批杀手级应用正在赶来Character AI、Github Copilot、Midjourney等。
- 开发者是关键。
- 形态越来越复杂。总体来说正在从个人生产力工具变成系统生产力。
- 版权问题更受关注。
我们正处什么位置
- AI优先的应用留存并不是很好。生成式AI留存中位数为14%左右。这意味着用户还没有在生成式人工智能产品中找到足够的价值来每天使用它们。简而言之生成式AI最重要的不是找到客户或者需求,而是证明价值。
- 思维链、思维树和反射等新兴推理技术正在提高模型执行更丰富、更复杂的推理任务的能力,缩小客户期望与模型能力之间的差距。开发人员正在使用像Langchain这样的框架来调用和调试更复杂的多链序列。
- 像RLHF和微调这样的迁移学习技术正变得越来越容易获得,特别是随着最近GPT-3.5和Llama-2的微调,这意味着公司可以根据其特定领域调整基础模型并从用户反馈中进行改进。开发人员可以从Hugging Face下载开源模型,并对其进行微调以实现高质量的性能。
- 检索增强生成正在引入有关业务或用户的上下文,并提高真实性和实用性。来自Pinecone等公司的矢量数据库已成为RAG的基础设施骨干。