Ai是一块“五层蛋糕”

1 阅读6分钟

⚠️注: 以上内容仅代表本人在当前时间段的观点,仅供参考,大佬勿喷,欢迎友善讨论,谢谢。

文章主要表达的核心观点就是: Ai并非单一的技术或者产品,其架构是由五个紧密相关的层级构成的。这五个层级自上而下分别为:能源->芯片->基础设施->模型->应用

能源是最底层的基础,因为实时生成答案是需要消耗电力的。上层建筑受制于底层基础,如果没有足够的、稳定的、廉价的电力,那么再先进的算法也只能停留在纸面上,很难或者无法变成真正的智能服务。训练模型需要电力、AI数据中心需要7x24小时不间断的稳定的电力供应等。

所以在Ai的时代下,能源能力直接决定了Ai发展的上限和竞争的能力。因为如果一个国家或者地区供电不足,或者电力价格高昂的情况下,首先就是难以训练模型,第二呢就是每次运行模型的情况下,成本会更高,第三呢这样子会导致自己地区的优秀人才流出。

芯片的核心是用来训练大模型和支持大模型的推理能力上限,在训练模型上,需要处理海量数据,让模型从零学习。所以需要极致的并行计算能力、高带宽内存和快速的芯片间通信。而在答案推理上,也需要低延迟、高吞吐量和更好的能效比。

而芯片的几大维度都会影响模型能力的“天花板”,

  1. 算力:简单理解就是芯片每秒能进行的计算次数,这个决定了可以训练的模型规模的上限,以及对应的训练速度。
  2. 内存带宽:决定模型读取数据的速度
  3. 内存容量:芯片能直接容纳多少模型参数,简单理解就是芯片能否装下大模型,如果模型太大放不下,就需要多芯片“拼接”,增加复杂度。
  4. 互联技术:芯片与芯片之间通信的速度,这就决定了芯片和芯片之间是否可以协同地高效合作
  5. 能效比:每瓦特电力能产生多少计算,这个是决定了运营成本,能效低的芯片会导致过高无法持续性使用。

而关于芯片这一点,也引发出了另外一层的思考,也就是为什么国外禁止高端芯片流入国内,这就是所谓的地缘政治博弈,因为想要训练出顶尖的大模型,高端芯片是非常重要的,如果没有的话,就只能通过更多数量的芯片去进行弥补,或者需要去花更多的精力研发替代的方案,这就会增加研发的时间、资金、还有工程的复杂度。

基础设施简单理解就是建设Ai数据中心所需要的一切物理还有社会条件的总和

  1. 能源供应满足、气候条件满足、地质稳定、远离人口密集区的地皮。
  2. 满足超高功率、极高稳定性的供电能力
  3. 超低延迟、超高带宽的网络
  4. 完整、出色的人员团队,例如数据中心的设计师、建筑工人、电工、管道工、网络工程师等。
  5. 精密的空调系统,保证硬件的基础冷却。

第四层就是模型,模型的本质就是一个巨大化、参数化的“函数”或者叫“概率统计模型”,所谓的智能就是它会从海量数据中学习到的模式和规律。 训练的数据影响了它的能力,例如常见的对话模型、生物模型、医疗模型等。

智能体和对话大模型的区别在于,智能体是用来完成目标的,当你给它一个目标的情况下,它会自己去琢磨实现的步骤,并且会调用“工具”。常见的例如最近很火的小龙虾(OpenClaw)。

第五层的应用指的就是Ai在现实生活中应用,例如自动驾驶、具身智能、法律助手等。 这也是文章的核心之一,也就是上层的需求带动了下层的就业岗位。就以自动驾驶为例

  1. 模型层:为了满足自动驾驶的需求,就需要更多的模型训练工程师、算法工程师等。
  2. 基础设施:为了训练这些模型,就需要更多的Ai数据中心,也就需要更多的数据中心设计师、电工、管道工、网络工程师等。
  3. 芯片:为了满足这些公司的需求,就需要更高级、更好用的芯片,也就增加了例如芯片设计工程师、封装测试人员等岗位。
  4. 能源:为了满足电力的需求,就需要例如电网公司、发电厂的建设和运维人员的岗位。

所以文章表示,在这个时代,就业岗位并没有消失,只是转移了。从传统领域转向了Ai(科技)的基础设施的建立和维护上。在这个时代,想要参与这场Ai时代的变革,并不一定需要特别高的学历,电工、技工等技能在一定场景下也是非常稀缺的。因为这不是零和博弈,而是“产业结构性的变迁”

就比如汽车和马车的更迭,汽车的出现确实让马车夫失业了,但是它也间接创造了例如司机、汽车维修工、加油站服务员、公路建设人员这些新的职业,进步的本质是使用更高效的方式来满足需求,并且在这个过程中创建出新的分工

在这个时代作为普通人要学会顺势而为,Ai是一个强大的工具,就例如当年的蒸汽机、互联网等。这些东西淘汰的不是所有人,而是那些不愿意掌握学习新工具的人

要清楚社会在进步,很多的岗位可能会从旧领域转移到了新的领域,现在是快速发展的时代,咱们作为普通人,只能尽可能让自己学会将自身拥有的技能去和这个时代的新工具进行融合,实现1+1>2的效果了。