复杂推理
这部分是构建AGI的一些技术
规划与智能体
首先分析大模型的不足:
- 上节课讲到的简单推理,中间步骤容易错,难以修改
- 训练之后信息没法及时更新,不借助外力及时性很差
- 每次重启之后上会提供的上下文没有留下(鱼的七秒记忆)
综上所述,模型需要引入一些外力,即存储和规划来拓展能力。计算机相关专业的同学可以回想一下计算机组成原理,把智能体架构和CPU组成类比一下,模型本体当ALU,规划当IR,存储就是memory。做控制的同学可以联想一下感知-预测-决策-规划-驱动的回路。三千大道殊途同归,有点返璞归真的感觉了没。
做完这些改进后我们能得到一个像模像样的agent了。
复杂推理与慢思考
这部分主要是推理能力的进阶,快思考到慢思考,像是人类感谢和理性的结合。
总结:这部分能发现很多学科交叉的内容,让我联想到曾经学过的许多知识,也正如最近和很多同学最近交流的感悟一样,新技术的发展让人们再次打破学科的壁垒,通过模型研究也反思改进自身的思考学习能力,非常期待人机协同进化的未来。