Datawhale组队学习-大语言模型-day08复杂推理这部分是构建AGI的一些技术规划与智能体首先分析大模型的

复杂推理

这部分是构建AGI的一些技术

规划与智能体

首先分析大模型的不足：

上节课讲到的简单推理，中间步骤容易错，难以修改
训练之后信息没法及时更新，不借助外力及时性很差
每次重启之后上会提供的上下文没有留下（鱼的七秒记忆）

综上所述，模型需要引入一些外力，即存储和规划来拓展能力。计算机相关专业的同学可以回想一下计算机组成原理，把智能体架构和CPU组成类比一下，模型本体当ALU，规划当IR，存储就是memory。做控制的同学可以联想一下感知-预测-决策-规划-驱动的回路。三千大道殊途同归，有点返璞归真的感觉了没。做完这些改进后我们能得到一个像模像样的agent了。局部截取_20250319_231620.png

复杂推理与慢思考

这部分主要是推理能力的进阶，快思考到慢思考，像是人类感谢和理性的结合。

局部截取_20250319_232436.png

总结：这部分能发现很多学科交叉的内容，让我联想到曾经学过的许多知识，也正如最近和很多同学最近交流的感悟一样，新技术的发展让人们再次打破学科的壁垒，通过模型研究也反思改进自身的思考学习能力，非常期待人机协同进化的未来。