Datawhale组队学习-大语言模型-day08

78 阅读1分钟

复杂推理

这部分是构建AGI的一些技术

规划与智能体

首先分析大模型的不足:

  1. 上节课讲到的简单推理,中间步骤容易错,难以修改
  2. 训练之后信息没法及时更新,不借助外力及时性很差
  3. 每次重启之后上会提供的上下文没有留下(鱼的七秒记忆)

综上所述,模型需要引入一些外力,即存储和规划来拓展能力。计算机相关专业的同学可以回想一下计算机组成原理,把智能体架构和CPU组成类比一下,模型本体当ALU,规划当IR,存储就是memory。做控制的同学可以联想一下感知-预测-决策-规划-驱动的回路。三千大道殊途同归,有点返璞归真的感觉了没。 做完这些改进后我们能得到一个像模像样的agent了。 局部截取_20250319_231620.png

复杂推理与慢思考

这部分主要是推理能力的进阶,快思考到慢思考,像是人类感谢和理性的结合。

局部截取_20250319_232436.png

总结:这部分能发现很多学科交叉的内容,让我联想到曾经学过的许多知识,也正如最近和很多同学最近交流的感悟一样,新技术的发展让人们再次打破学科的壁垒,通过模型研究也反思改进自身的思考学习能力,非常期待人机协同进化的未来。