LangChain框架入门系列(1)：基础概念LangChain 是一个用于开发由大型语言模型提供支持的应用程序的框架

什么是LangChain

LangChain 是一个用于开发由大型语言模型提供支持的应用程序的框架（LLMs）。旨在帮助开发人员使用语言模型构建端到端的应用程序。它提供了一套工具、组件和接口，可简化创建由大型语言模型 (LLM) 和聊天模型提供支持的应用程序的过程。LangChain 可以轻松管理与语言模型的交互，将多个组件链接在一起，并集成额外的资源，比如API，数据库等等
目前LangChain提供了 Python 和TypeScript的软件包

为什么要用LangChain

智能数据整合： Langchain框架支持将大规模语言模型与多样化数据存储系统进行深度对接，包括结构化数据库、非结构化PDF文档及其他文件格式。该特性使得企业能够充分挖掘私有知识库中的潜在价值，通过语义解析实现精准信息抽取

操作自动化扩展： Langchain不仅可以提取信息，还可以根据这些信息执行特定的操作，比如可以自动化发送邮件。其核心优势在于采用动态参数化编程范式，避免硬编码，显著提升系统可维护性和扩展性

LangChain的核心组件

Langchain主要由3个核心组件构成：

Compents：“组件”

为LLMs提供接口封装、模板提示和信息检索索引

Chains：“链”

将不同的组件组合起来解决特定的任务，比如在大量文本中查找某些具体信息

Agent：“代理”

使得大模型能够与外部环境进行交互，例如通过API请求执行某些具体操作

Langchain的核心概念

关于LangChain主要有以下几个核心概念，如下图所示：

LLM Wrappers： 包装器，允许应用程序连接到大型语言模型，如 GPT-4 等大模型
Prompt Templates： 提示词模板，让用户避免硬编码文本输入，用户输入可以动态插入到模板中，并发送给语言模型
Indexes： 索引，用户需要借助索引从大模型中提取信息
Models： 负责理解和生成语言，提示用于引导模型输出
Chains： 链，将不同的组件组合起来解决特定的任务，比如在大量文本中查找某些具体信息
Agent： 使得大模型能够与外部环境进行交互，例如通过API请求执行某些具体操作
Embedding： 嵌入与向量存储 VectorStore 是数据表示和检索的手段，为模型提供必要的语言理解基础

上图中的鹦鹉其实表示系统具备强大的自然语言处理能力，说明大语言模型能够像鹦鹉一样“复述”或“回应”用户的输入。右上图克制，整个系统构建了一个高度集成的架构，不仅能够处理复杂的语言任务，还能处理高级语言任务并在多种环境下进行动态交互。更多关于LangChain的概念可以查看这个页面

LangChain的工作原理

Langchain的整体流程可以分为以下几个阶段，如下图所示：

用户提问： 用户提交一个问题或请求
向语言模型发起查询： 系统将用户的问题转化为向量表示，并在向量数据库中进行相似度匹配
检索相关内容： 从向量数据库中找出与问题相关的内容片段，并传递给语言模型
生成回答或执行任务： 语言模型结合问题和补充信息，生成对应的回答或执行相应的操作

小结

本小结主要介绍了LangChain框架的一些基础概念，涉及到它的基本组件，核心概念以及简单介绍了一下LangChain的基本工作原理，先对它有个大概的认知，后续在实战系列的时候能更好的理解

资源分享

为了便于大家学习AI应用方面的知识，秀才也整理了从入门到精通再到面试的大模型学习资料

感兴趣的同学可以关注公众号IT杨秀才，回复：大模型即可领取

学习交流

如果您觉得文章有帮助，点个关注哦。可以关注公众号：IT杨秀才，秀才后面会在公众号分享 LangChain框架实战，小白入门大模型应用开发 的系列知识。也会持续更新更多硬核文章，一起聊聊互联网那些事儿!

往期推荐
大模型初体验：DeepSeek本地部署
 LangChain+DeepSeek小白入门大模型应用开发(1)
大模型应用开发入门系列(1)：Hello LangChain
LangChain框架入门系列(2)：Model I/O
LangChain框架入门系列(3):数据连接
 LangChain框架入门系列(4)：链
 LangChain框架入门系列(5)：Memory
LangChain框架入门系列(6)：RAG
LangChain框架入门系列(7)：Agent