〇、OpenAI开发者大会成果与关键话题
2024年OpenAI规划了三场重要的开发者大会,分别在总部、英国伦敦和新加坡举办。伦敦站的开发者大会带来了令人印象深刻的现场实机演示,如搭载o1 - mini的无人机完成从编程到起飞全过程,展示了对复杂设备的实时控制能力;开发团队在30秒内构建一款iPhone应用,凸显了技术实力。OpenAI CEO山姆·阿尔特曼(Sam Altman)在大会期间接受专访,分享了诸多对AI发展的深刻见解,涵盖模型演进、企业战略、智能体定义、未来定价、人才发展等关键话题。
一、模型演进与推理能力
- o系列模型的重要性
OpenAI希望在各方面取得突破,当前特别关注模型的推理能力,认为其能解锁下一个重大价值创造飞跃,助力科学研究、编写复杂代码等,o系列模型的快速迭代对战略布局至关重要。
- 模型扩展定律
对于模型扩展定律(Scaling Law),Altman相信模型能力提升的轨迹会保持目前势头且持续较长时间,尽管过程中遇到诸多挑战,如GPT - 4研发时曾遇到难以解决的问题,但最终找到解决方案,o1和推理模型的研究之路也漫长曲折。
二、企业战略与市场影响
- 技术路线选择
未来会在多个方向努力,既会开发如o1这样的精简模型,也会追求大规模模型,目前更侧重于提升模型推理能力。
- 对创业公司的影响
对于非技术背景创始人开发无代码工具,目标会实现,但目前应先提升编程人员生产力,未来有望提供高质量无代码工具。对于正在调试RAG系统的创始人,若业务基于弥补当前模型小缺陷,未来可能受影响;若能受益于模型持续进步则与OpenAI愿景一致。创业者应认识到模型进步速度,选择能从模型进步中获益的领域。
- 市场价值创造
AI将创造数万亿美元新市值,在构建此前难以或无法实现的产品服务方面,OpenAI会努力让模型更强大,同时在新技术上构建创新产品服务也会越来越好。软银孙正义预测超级人工智能每年产生9万亿美元价值,Altman认为即使达到其零头也是显著成绩,AI行业需巨额资本投入也将带来巨大经济收益,医疗、教育等领域应用将创造巨大价值。
三、智能体相关
- 智能体定义与误解
Altman定义AI智能体为能接受长期任务且执行中几乎无需督导的存在。人们常误解智能体用途,如仅认为是帮订餐打电话等简单任务,实际上更应关注像聪明资深同事般能在项目中协作、独立完成任务并高质量交付成果的智能体,以及人类因带宽限制无法完成的大规模并行任务,如同时联系300家餐厅找最佳餐食或优惠。
- 对SaaS定价模式的影响
未来定价可能基于持续为用户工作的计算资源量,而非按座位或智能体收费,想象用户可根据任务需求说“我需要一个GPU、10个GPU或100个GPU持续处理任务”。
- 模型需求
实现智能体功能需要构建大量基础设施和框架支持,o1模型已为智能体任务指明方向,展示了相关模型应有的样子。
四、模型资产性质与投资
- 模型贬值与投资价值
模型确实是会贬值的资产,但投入训练成本并非不值得,训练产生正向复合效应,能使下次训练更熟练,从实际收入看投资值得。不过,若技术落后或产品缺乏商业要素,投资回报可能难获取,OpenAI因有ChatGPT和庞大用户基础能分摊成本。
- 模型差异化发展
OpenAI最关注推理能力提升,这将开启新价值创造飞跃,同时会在多模态等多维度改进模型,加入对用户重要的功能。在多模态推理应用方面,希望能像人类婴儿时期虽语言不成熟但能进行视觉推理一样水到渠成,且图像模型会有显著进步。
五、人才相关
- 人才浪费与潜力发挥
世界上很多有才华的人因所在公司管理不善、国家缺乏优秀企业等原因无法发挥全部潜力,AI有望改变这一状况,帮助每个人充分发挥潜能。
- 人才招聘策略
Altman创立OpenAI时约30岁,认为招聘不应局限于年龄,“只招年轻人”或“只招有经验的人”策略有失偏颇,应坚持极高人才标准,缺乏经验不意味着缺乏价值,年轻人能带来新视角、能量和独特价值,但设计复杂基础设施时经验丰富者也不可或缺。
- OpenAI文化特色
OpenAI文化能孕育持续探索全新未经验证领域的能力,这是推动人类进步重要要素,很多组织声称具备但实际很少做到,Altman希望退休后写一本书分享建立此类组织文化的经验,这种创新文化对世界很重要。
六、其他观点
- 开源角色
开源模型在生态系统中有重要地位,同时精心设计、集成度高的服务和API也有价值,用户会根据需求选择。
- AI革命类比
AI革命不应比喻为互联网,而更像晶体管。互联网入门门槛低,而构建AI本身不同;电力比喻也不恰当。晶体管是物理学新发现,扩展性强、渗透各领域,带来科技进步和经济提升,虽人们不常意识到产品背后的晶体管技术,但它已成为理所当然的存在。
- 面临的挑战与担忧
技术复杂性:半导体供应链是担忧之一,位列所有忧虑前10%,但整个领域尝试做的事情复杂性极高,包括电力供应、网络架构决策、芯片获取、风险平衡、研究进度跟上、产品利用成果支付成本等各方面,生态系统复杂性呈分形状态,是Altman最担心的问题。
决策困扰:日常决策数量多且模棱两可是一大挑战,Altman虽不认为自己比别人更擅长决策,但仍需做出决定,他认为应咨询15 - 20个不同领域值得信赖的专家,而非依赖单一全能者。
七、快问快答环节
- 构建方向选择(如果23、24岁):选择AI赋能的垂直领域,如打造最好的AI辅导产品或出色教学系统,也可以是AI律师、AI CAD工程师等类似方向。
- 写书计划书名:未想好,主题可能关于人类潜能。
- 应关注方向:期待能理解用户整个生活的AI,虽不需要无限上下文理解能力,但能访问用户所有数据等。
- 近期惊讶之事:有一项现在不能讨论的惊人研究成果。
- 尊重的竞争对手:尊重领域内所有参与者,认为大家都在做令人惊叹的工作,很难说特别突出的一个。
- 最喜欢的OpenAI API:新的实时API非常出色,API业务已具规模且功能众多。
- AI领域敬佩之人(除OpenAI人员):表扬Cursor团队,其将愿景变为现实,在创造用户体验和价值方面成就突出。
- 延迟与准确性权衡:需要灵活调节机制,由用户根据场景控制,如快问快答需低延迟,若期望重大科学发现可等待准确性提升。
- 领导力提升方面:产品策略细节是当前弱项,公司需要更强有力和清晰的愿景,希望自己在这方面能做得更好,已招聘Kevin Weil作为CPO,其具备纪律性,包括关注重点、站在用户角度思考、严谨务实等优点。
- 五年和十年愿景:两年内规划较清晰,五年内技术进步速度难以置信,不仅AI研究有新发现,其他科学领域也会受影响;社会变化程度可能出人意料地小,如计算机通过图灵测试未带来社会巨大变革,未来科技进步会超越预期,但社会会保持相对稳定,长远来看变革终将巨大。