Langchain文档 语言模型

298 阅读1分钟

语言模型

LangChain为两种类型的模型提供接口和集成:

LLMs:将文本字符串作为输入并返回文本字符串的模型 聊天模型:由语言模型支持,但以聊天消息列表作为输入并返回聊天消息

LLMs与Chat Models

LLMs和Chat Models有微妙但重要的区别。在LangChain中,LLMs指纯文本完成模型。它们包装的API接受一个字符串提示作为输入,并输出一个字符串完成。OpenAI的GPT-3是实现为LLM。聊天模型通常由LLM支持,但专门针对进行对话进行调整。关键是,它们提供者API公开了与纯文本完成模型不同的接口。它们不仅需要单个字符串,还需要一系列聊天消息作为输入。通常这些消息带有说话者标签(通常是“系统”,“AI”和“人类”之一)。然后他们会返回一个(“AI”)聊天消息作为输出结果。GPT-4和Anthropic's Claude都被实现为Chat Models。

为了使交换LLMs和Chat Models成为可能,两者都实现了基础语言模型界面(Base Language Model interface) 。这暴露出共同方法"predict" ,该方法采用一个字符串并返回一个字符串,“predict messages”,该方法采用信息并返回信息。 如果您正在使用特定的模型,则建议使用该模型类的特定方法(即LLMs的“predict”和Chat Models的“predict messages”),但如果您正在创建应与不同类型的模型一起使用的应用程序,则共享接口可能会有所帮助。