大模型的技术生态——怎么理解大模型技术以及应用技术
“ 大模型的技术生态本质上就是围绕着大模型这个“人”转的。”【AI大模型教程】
大家在学习大模型应用开发时会发现有很多种不同的技术方向和框架,而且不同的技术有其使用的业务场景,因此可能就有部分人认为,不同大模型应用技术之间是无关的。
但事实上,从技术的角度出发,技术只是一种工具,而很多业务场景可能需要同时结合多种不同的技术才能满足复杂的业务需求。
只不过技术生态经过这么多年的发展,已经形成了一套完善的架构机制,对我们使用者来说入口都是统一的,但其背后的技术实现却是复杂的,并且是可以更换的,但最终对我们用户来说都是无感的。
大模型应用的技术生态
既然是大模型应用,那么其当然是以大模型为核心技术的应用,所以任何与大模型相关的技术栈的核心都是以大模型为主。
大模型作为目前为止人工智能技术的代表,其核心就是让大模型具备人的能力,思考和行动的能力;但受限于目前的技术能力,因此大模型还不具备作为“人”的能力。
但我们依然可以使用大模型来解决一些问题,提升工作效率。
而人的能力并不是天生的,而是通过后天学习得来的,因此大模型也需要经过预训练才能获取需要的知识。
而人之所以能成为人,原因就在于其具备强大的独立思考能力和动手能力——使用工具的能力。
所以,我们对模型的期望也是如此,想让模型具备强大的思考和动手能力;因此这就产生了大模型的几个主要应用场景:
自然语言的理解能力
创作能力
使用工具的能力
但由于大模型本身没有物理实体,因此我们需要给大模型装上手和脚;这就使得大模型具备了使用工具的能力——Agent智能体。
事实上大模型的核心能力还在于其理解和生成能力的结合;不论是自然语言理解,还是创作,以及使用工具;本质上来说都是大模型理解和生成能力的体现。
首先,大模型肯定需要具备自然语言理解的能力,否则它都不知道自己要干啥;其次,创作能力是在其理解能力的基础之上,通过模仿其它的作品,根据用户的需求,生成相对应的作品;所以其本质上还是理解和生成的能力。
而关于智能体的理解就更简单了,比如说我们出门要开车,吃饭要用碗,拍照要用相机;同样,大模型要想完成一些任务也需要这些工具才行。
但是有一点我们要理解的是,大模型并不负责工具的具体执行,大模型的作用只是根据工具列表选择一个合适的工具,并给工具提供必要的参数;所以,所谓的智能体,其实就是把大模型变成了一个程序员,它能够理解业务需求,然后完成编码,但代码的执行是由计算机而不是程序员负责的。
所以说理解大模型的应用技术原理并不复杂,甚至可以说是很简单,只需要从人的角度去理解就可以了;但大模型的执行过程却非常的复杂,并且是极度的不稳定,而这就是我们做好强大的容错处理,否则大模型应用就会随时会成为一颗定时炸弹。