“青训营X豆包MarsCode 技术训练营第一课 | 豆包MarsCode AI 刷题”

42 阅读2分钟

AI,新的历史节点:历史上的互联网时刻复现。

Lanchain的诞生

LangChain 这个以大模型为引擎的全新应用开发框架从天而降,几乎和 ChatGPT 一起面世。作为程序设计者的我们,现在可以利用大模型的潜能以及LangChain的便捷,开发出令人惊叹的智能应用。LangChain作为新一代AI开发框架,必将受到程序员的追捧,点燃AI应用开发的新热潮。

什么是LangChain?

专为开发基于语言模型的应用而设计的框架。可以通过API调用大语言模型,更能实现高级功能。 1、数据感知。能够将语言模型与其他数据源连接起来,从而实现对更丰富、更多样化数据的理解和利用。 2、具有代理性。能够让语言模型与其环境进行交互,使得模型能够对其环境有更深入的理解,并能够进行有效的响应。将语言模型赋予“设身处地”的能力。

image.png

LangChain 的6大组件

模型、提示模板、数据检索、记忆、链、代理。

什么是大语言模型?

就是人工智能模型,基于深度学习技术,eg:神经网络,来理解人类的语言。 大语言模型主要就是体现在参数的数量非常多。 LangChain 是一个全方位的、基于大语言模型这种预测能力的应用开发工具,它的灵活性和模块化特性使得处理语言模型变得极其简便。 它会通过不断地学习和调整参数,使得自己的预测越来越准确。基于神经网络的反向传播的技术,不断进行调整权重参数,使得整个模型能够更加顺滑的适应不同的场景。

存在问题:大语言模型是如何训练的?这个数据集的使用和场景的匹配是如何的?大语言模型的训练工程中的反向传播导致的梯度下降,如何能够将训练好的模型转换为普适模型?????

首先,第一大特性:LangChain 的预构建链功能,就像乐高积木一样,无论你是新手还是经验丰富的开发者,都可以选择适合自己的部分快速构建项目。

其次,第二大特性:对于希望进行更深入工作的开发者,LangChain 提供的模块化组件则允许你根据自己的需求定制和创建应用中的功能链条。

可以通过Python来进行开发。