LangChain 安装与入门
一、大语言模型简介
1. 什么是大语言模型(Large Language Model, LLM)?
-
定义:大语言模型是一种基于神经网络的人工智能模型,经过大量文本数据训练,能够理解、生成和处理自然语言。常见的大语言模型包括 OpenAI 的 GPT 系列、Google 的 Bard、Meta 的 LLaMA 等。
-
特点:
- 语言理解与生成能力:能回答问题、撰写文章、翻译语言等。
- 上下文处理:支持多轮对话,记忆并利用上下文信息。
- 多领域知识:涵盖了文学、科技、历史等多个领域,具备通用性。
-
应用场景:
- 文本生成:如自动写作、代码生成。
- 语言翻译:将一种语言翻译为另一种语言。
- 对话系统:如智能客服、聊天机器人。
- 知识问答:基于模型内置知识库回答问题。
二、LangChain 的安装
1. 什么是 LangChain?
LangChain 是一个框架,用于将大语言模型与多种工具(如数据库、API)结合,以构建复杂的语言任务应用。它支持:
- 管理上下文
- 处理长文本
- 集成外部工具(如搜索引擎、文件解析器)。
2. 安装步骤
1) 安装基础依赖
确保 Python 版本为 3.8 或更高,安装 LangChain:
bash
复制代码
pip install langchain
2) 安装 OpenAI 相关依赖
如果使用 OpenAI API 作为大语言模型接口,还需要安装 OpenAI 的 Python SDK:
bash
复制代码
pip install openai
3) 可选依赖
LangChain 支持多种工具,如 pandas、faiss 等,根据需求选择安装:
bash
复制代码
pip install pandas faiss-cpu
4) 验证安装
安装完成后,可通过以下命令检查版本:
bash
复制代码
python -c "import langchain; print(langchain.__version__)"
三、LangChain 的基本使用
LangChain 的核心是通过链式操作管理多种任务,以下是几个关键模块的用法:
1. 加载语言模型
LangChain 支持多种模型(如 OpenAI、Hugging Face 等)。以下以 OpenAI 的 GPT-4 为例:
python
复制代码
from langchain.llms import OpenAI
# 加载 OpenAI 模型
llm = OpenAI(model="gpt-4", openai_api_key="your-api-key")
# 测试模型输出
response = llm("用一句话描述LangChain")
print(response)
2. Prompt 模板
LangChain 提供 PromptTemplate 类,用于模板化构造提示词:
python
复制代码
from langchain.prompts import PromptTemplate
# 创建模板
template = PromptTemplate(
input_variables=["name"],
template="你好,{name}!欢迎使用LangChain!"
)
# 渲染模板
prompt = template.format(name="小明")
print(prompt) # 输出:你好,小明!欢迎使用LangChain!
3. 链式调用(Chains)
LangChain 可以将多个任务串联起来执行:
python
复制代码
from langchain.chains import LLMChain
# 定义语言模型和提示模板
llm_chain = LLMChain(llm=llm, prompt=template)
# 执行链式任务
output = llm_chain.run({"name": "小明"})
print(output)
四、OpenAI API 使用
1. 注册与获取 API 密钥
- 注册 OpenAI 账号(官网链接)。
- 登录后在 "API Keys" 页面生成 API 密钥。
- 复制密钥备用。
2. 调用 OpenAI API
使用 openai 库直接调用 OpenAI 的模型:
python
复制代码
import openai
# 设置 API 密钥
openai.api_key = "your-api-key"
# 调用 ChatGPT(GPT-4)
response = openai.ChatCompletion.create(
model="gpt-4",
messages=[
{"role": "system", "content": "你是一个帮助用户的助手。"},
{"role": "user", "content": "什么是LangChain?"}
]
)
# 提取回答
print(response['choices'][0]['message']['content'])
3. 常见参数说明
- model:指定使用的模型(如
gpt-3.5-turbo或gpt-4)。 - temperature:控制生成文本的随机性(0.0 越确定,1.0 越随机)。
- max_tokens:控制返回的文本长度。
五、总结
- 大语言模型是构建智能应用的基础,LangChain 提供了灵活的框架来集成大语言模型与多种工具。
- 安装 LangChain 和 OpenAI 依赖非常简单,但需要申请 OpenAI API 密钥。
- LangChain 的链式结构和 Prompt 模板功能极大提升了任务的自动化能力。
- OpenAI API 是大语言模型的核心接口,需注意使用成本和 API 调用限制。