大模型

39 阅读1分钟

一.大模型的演变

1.什么是人工智能?

人工智能就是它能够代替一部分人,或者说能够把我们人的思想给他量化,来帮助我们提高效率。

1740972643967.png

2.机器的监督学习与无监督学习的区别:是否使用带标签的数据进性训练

3.大模型的训练

大模型训练分为3个阶段:
1.预训练:是在训练我们底层通用能力
2.SFT(监督微调):训练某个专业进性精修
3.RLHF(基于人类反馈的强化学习):在某个专业上会有很多的问题不好解决,此时请教别人,不断问和反馈,
  我们也会成为这个领域的专家

4.基础模型(大模型)的特点

1.规模参数量大
2.适应性和灵活性强
3.广泛数据集的预训练
4.计算资源需求大

5.大模型分类

graph TD
基础模型 --> 大语言模型(LLM)
基础模型 --> 多态模型 --> 计算机视觉模型
多态模型 --> 音频处理模型

6.基础大模型

1741662014869.png

Agents

1.Agents是什么?

AI Agents是基于LLM的能自主理解、自主规划、执行复杂任务的智能体

1741664165876.png

2.Agents决策流程图

1741664624056.png

1741664657565.png