OpenAI o1模型的推出获得了外界极大的关注,相关报道层出不穷。报道中对o1模型的溢美之词不绝于耳,那么o1模型具体会在哪些方面造成影响呢?
本文从AI行业自身发展、创业和工作以及科研发展三个方面来预测OpenAI o1模型对未来造成的影响,思考AI未来的价值。对于o1模型还不了解的朋友,欢迎阅读之前的文章不用懂技术,一文帮你理解最火的OpenAI o1模型。
如何影响AI行业的发展
算力更加短缺
OpenAI o1模型揭示了一个事实:在推理阶段,花费的算力越大(对应时间也越长),问题被模型解决的越好。可以说这是缩放定律(Scaling Law)从训练阶段,延伸到了推理阶段。
大语言模型的应用总体可以分为预训练、后训练、微调和推理四个阶段。在o1模型之前,最大的算力消耗位于预训练阶段,可能需要数十万顶级显卡的参与。不过预训练是一锤子买卖,训练一次模型就可以长期使用。
推理阶段就是运行训练好的大语言模型,回答用户的问题的过程。之前模型回答问题的好坏取决于训练阶段的算力和数据投入,推理阶段增加算力并不能提高回答能力。但是o1模型改变了这点,推理阶段更多的算力可以显著提高大语言模型的推理能力。
推理阶段的算力消耗不是一锤子买卖,用户使用一次就需要消耗一次的算力。所以使用的人越多、越频繁、单次消耗的越多,总的算力需求就越大。
换句话说,为了提高产品质量。AI行业不仅要在训练阶段卷算力,还要在推理阶段卷。现在算力的瓶颈在富士康的产能上,短时间内无法改变。所以算力将会更加短缺。
地平线上的新方向
大语言模型的行业竞争在o1之前只有一个明确的方向:训练出更大模型。
2023年ChatGPT横空出世,国内公司在方向出来后,也奋起直追。从而有了通义千问、文心一言、豆包等对标的模型。虽然总体上不如ChatGPT、Claude,不过也算是没有掉队。
OpenAI在没有发布o1之前,由于核心人员的不断出走、Sora和her的上线推迟,外界普遍对其前景感到担忧。似乎OpenAI慢了下来,国内公司能够赶超的可能性增加了。
o1的出现以最直接的方式回应了外界的质疑,OpenAI依然走在了所有公司的前面。而且这个方向,只有OpenAI走了。o1是基于强化学习的做出的成果,其非常依赖具体的实践。这一次OpenAI完全没有透露背后的技术细节,甚至是当作商业机密对外保密的。
大语言模型公司将因为o1而调整自己的公司策略,将更多资源投入到思维链的强化学习中——做出自己的o1模型。
不断加高的门槛
算力需求的增大,以及强化学习在思维链上的运用都在不断加高研制新大语言模型的门槛。资金、算力、数据、人才,甚至电力都将成为制约一家大语言模型公司发展的因素,可以说研发大语言模型将成为超级大公司,甚至国家才能完成的事情。
行业中最有实力做这件事的公司包括OpenAI(微软)、Google、Meta、xAI、Anthropic,国内还没有看到能够与其竟争的公司。在以后可能看到国内商业公司建立同盟,共同开发大语言模型。也可能看到国家层面的参与。
对创业和工作的影响
人机交互的启示
o1在数学、科学和编码方面展示出了强大的推理能力,这种能力其实也可以用在理解人的意图上,带来人机交互的变革。
现在的人机交互是建立在机器不能理解人类意图的基础之上的。鼠标键盘、触摸屏、智能音箱,人类对他们的态度都是命令式的。好的人机交互就是能顺畅的将人类的意图表达出来。
o1之前的模型开始可以理解人类的语言(至少从结果上看像是这样),但是模型缺乏一些常识,偶尔还会胡编乱造。在与大模型交互时,常常感觉它似乎懂了,但又没完全懂,总是不能完全理解人的意图。但是o1的强推理能力则可以改变这一点。
举一个经典的曲别针例子。曾经有人提出,如果我们命令机器人尽可能的生产曲别针,那么机器人会不会把地球都拆了来实现这个目标。o1出来后这看起来是不会的,当模型学会了推理,它就能将各种因素纳入到自己的思维链中。从而推理出,这不符合常识。
常识和推理加入到人机交互中,就可能实现从命令式到声明式的可能。人类不再是命令软件、机器做什么,而是告诉AI自己想要什么,AI将去完成任务。
那么这意味着什么呢?至少有一点,现在的许多软件的界面就没有必要了,AI成为新的用户界面,它去接收用户的需求。然后直接调用算法来实现,存到数据库中。例如,对于日程软件,人们的需求是有一个可以记录和提醒的地方,那么为什么还需要一个复杂的日程设置界面呢?
向应用层驱赶
对于大部分创业者来说,只能去应用层发展。如果o1模型后面直接对外提供API,一段时间内可能连与之竞争的大公司产品都没有。摆在创业者面前的路只有一条,接入API,去具体的领域用新技术来更好满足人与社会的需求。
一定会有新的领域因为AI技术而诞生,但是在那之前,老领域将被AI渗透。渗透的过程伴随者新来者的胜利,与既得利益者的退场。AI将首先在互联网领域掀起波澜,现有的服务将被升级和替换。但AI不会改变应用APP,它将绕过软件、应用APP的形态,直接将需求满足。那将是新的应用层。
程序员的黄昏还是黎明
o1一个被人津津乐道的事实是它在Codeforce的编程竞赛中超过了89%的程序员。
程序员作为一种职业当然不会消失,但具体到个人的情况,就不好说了。o1现在的水平显然还无法替换再岗的程序员,但o1之后可能还有o2、o3。
放定律表明,o1之后的模型在编程能力上还会有显著进步,将来有一天可能会超越大部分程序员。只有少数顶尖程序员难以被取代,也不用去取代。他们的经验和技术创新将成为模型进步的数据源。
如果不想转行,那么尽早成为可以驾驭AI的程序员是正确的策略。
算力即是科研实力
著名数学家陶哲轩在使用了o1之后,评价它是一个本分的研究生。
社会培养一个陶哲轩眼中的本分研究生需要花费的时间与资源是巨大的,而且数量上是有瓶颈的。大部分聪明人都不可能去研究数学、物理、生物这些基础学科,社会对他们的需求是有限的。
但是o1给人们展现了另一种可能,堆算力可以得到上万、上十万个研究生。算力将成为探索科学的智力资源,算力越多科研实力将越强。
小结
o1的发布为AI下一步的发展指明了新的方向,更强的推理能力将解锁更多的可能性。未来已来,只是尚未流行,且分布不均。
欢迎点赞关注分享,我们下次见!