LangChain的模型I/O | 豆包MarsCode AI刷题LangChain通过提示模板、统一模型接口和输出解析

概述

LangChain 是一个专为集成大型语言模型（LLM）而设计的框架，其核心功能之一是提供简化和标准化的模型输入与输出（I/O）处理。LangChain通过提示模板、语言模型调用接口以及输出解析器这三大模块，实现了从提示生成、调用模型到结构化输出解析的完整闭环。

以下是对模型I/O的深入学习总结，辅以代码示例和实践见解。

模型 I/O 三大核心模块

提示模板（Prompt Template）
提示模板旨在生成高质量的输入提示，它支持动态参数替换和格式校验。LangChain为提示模板提供了灵活的构建工具，可以快速创建、复用和管理模板。
语言模型（Language Model）调用
LangChain通过统一的接口支持多种语言模型，包括大语言模型（LLM）、聊天模型（Chat Model）和文本嵌入模型（Embedding Model）。这种抽象层让用户可以轻松切换模型，而无需更改应用逻辑。
输出解析（Output Parsing）
通过解析器，LangChain将非结构化的模型输出转化为易处理的结构化数据（如JSON、字典等），从而极大提高了应用的开发效率。

提示模板的创建与应用

提示模板是模型 I/O 的起点，用于构造输入提示。以下代码演示了如何使用提示模板生成动态输入。

from langchain.prompts import PromptTemplate

# 创建提示模板
template = """您是一位专业的鲜花店文案撰写员。
对于售价为 {price} 元的 {flower_name} ，您能提供一个吸引人的简短描述吗？
"""
prompt = PromptTemplate.from_template(template)

# 填充模板变量
input_prompt = prompt.format(flower_name="玫瑰", price="50")
print(input_prompt)

输出：

您是一位专业的鲜花店文案撰写员。
对于售价为 50 元的 玫瑰 ，您能提供一个吸引人的简短描述吗？

提示模板的优点

复用性：定义一次模板，可用于生成多种提示。
动态性：支持动态参数替换，避免硬编码。
灵活性：集成验证机制，防止变量遗漏。

调用语言模型

LangChain通过统一接口封装了对不同模型的调用。在示例中，我们使用OpenAI模型生成鲜花文案。

import os
from langchain.llms import OpenAI

# 设置OpenAI API Key
os.environ["OPENAI_API_KEY"] = "你的OpenAI API Key"

# 创建模型实例
model = OpenAI(model_name="gpt-3.5-turbo-instruct")

# 调用模型生成文案
output = model.invoke(input_prompt)
print(output)

输出示例：

这支玫瑰，深邃的红色，传递着浓浓的深情与浪漫，令人回味无穷！

模型调用的特点

统一接口：支持多种模型，无需更改调用方式。
便捷切换：通过修改模型名称即可切换底层模型。

输出解析

LangChain的输出解析功能将模型返回的非结构化文本转化为结构化数据，便于后续处理。

实现结构化输出解析

下面的代码通过结构化输出解析器，将文案及其创作原因解析为JSON格式。

from langchain.output_parsers import StructuredOutputParser, ResponseSchema
from langchain.prompts import PromptTemplate

# 定义响应模式
response_schemas = [
    ResponseSchema(name="description", description="鲜花的描述文案"),
    ResponseSchema(name="reason", description="为什么要这样写这个文案")
]
output_parser = StructuredOutputParser.from_response_schemas(response_schemas)

# 获取格式指示
format_instructions = output_parser.get_format_instructions()

# 创建提示模板
prompt_template = """您是一位专业的鲜花店文案撰写员。
对于售价为 {price} 元的 {flower_name} ，您能提供一个吸引人的简短描述吗？
{format_instructions}"""
prompt = PromptTemplate.from_template(prompt_template, partial_variables={"format_instructions": format_instructions})

# 模型输入
input_prompt = prompt.format(flower_name="玫瑰", price="50")
output = model.invoke(input_prompt)

# 解析输出
parsed_output = output_parser.parse(output)
print(parsed_output)

输出示例：

{
  "description": "让你心动！50元即可拥有这支充满浪漫气息的玫瑰花束，让TA感受你的真心爱意。",
  "reason": "描述突出了浪漫和经济实惠的特点，吸引消费者。"
}

综合案例：批量生成鲜花文案并保存

以下代码演示了如何生成多个鲜花的文案，并将结果保存为CSV文件。

import pandas as pd

# 数据准备
flowers = ["玫瑰", "百合", "康乃馨"]
prices = ["50", "30", "20"]

# 创建结果DataFrame
df = pd.DataFrame(columns=["flower", "price", "description", "reason"])

# 批量生成文案
for flower, price in zip(flowers, prices):
    input_prompt = prompt.format(flower_name=flower, price=price)
    output = model.invoke(input_prompt)
    parsed_output = output_parser.parse(output)
    
    # 添加花名和价格
    parsed_output["flower"] = flower
    parsed_output["price"] = price
    
    # 保存到DataFrame
    df = df.append(parsed_output, ignore_index=True)

# 保存为CSV
df.to_csv("flower_descriptions.csv", index=False)

生成的CSV内容：

flower	price	description	reason
玫瑰	50	让你心动！50元即可拥有这支充满浪漫气息的玫瑰花束。	突出浪漫和经济实惠的特点。
百合	30	百合象征纯洁与美好，30元即可传递最真挚的祝福。	强调百合的象征意义。
康乃馨	20	康乃馨象征感恩与关怀，20元送给你最爱的人。	展现康乃馨的温馨内涵。

学习收获

LangChain提升开发效率
使用提示模板、统一模型接口和输出解析器，LangChain显著简化了大模型的集成与应用开发流程。
灵活应对模型切换
LangChain的接口抽象层屏蔽了底层模型的差异，使得开发者能专注于业务逻辑。
清晰的结构化输出
输出解析器将语言模型的非结构化文本转化为结构化数据，便于后续分析和存储。

总结

通过LangChain的模型I/O模块，我们能够快速构建以大模型为核心的应用程序。它的提示模板和输出解析功能大大提高了代码的可读性、可维护性和复用性。借助LangChain，我们能够从简单的实验过渡到复杂的企业级应用，为未来的大语言模型开发提供了坚实的基础。