AI 伴学笔记4 接入模型输出解析器微调与接入 LangChain 支持三种模型：大语言模型 LLM：输入文本，返

微调与接入

LangChain 支持三种模型：

大语言模型 LLM：输入文本，返回字符串
- OpenAI，豆包，星火等在线大模型，可参考此处接入
- 在 HuggingFace 下载预训练模型，微调后使用，如 Llama2。使用 HuggingFaceHub 或 HuggingFacePipeline
聊天模型 Chat Model：基于 LLM 但更结构化，支持将聊天消息列表作为输入
文本嵌入模型 Embedding Model：用于文本嵌入，将文本存入

[!note] 预训练模型：通过 Transformer 等架构初步学习词汇、语法、句子结构和上下文信息等语言知识后的模型

可使用 HuggingFace 下载预训练模型并进行微调，需要申请 HuggingFace Token 并安装 transformers 库

[!note] 模型量化：简化模型权重，以减少模型大小和计算需求，量化后的模型常以 GGML 或 GPTQ 结尾

创建类继承自 LLM，实现 _call 方法即可

构建语言响应，将文本信息转化为结构化信息，是包含以下方法的类：

LangChain 自带解析器位于 langchain.output_parsers 包中，可单独导入使用

使用 Pydantic 将输出解析为 Json 数据，并提供数据验证、数据转换等功能

Pasted image 20241110130922.png

Pasted image 20241110131043.png

Pasted image 20241110131322.png

Pasted image 20241110131508.png

自动修复解析器，用于修复模型返回的数据中的格式错误

原理：当格式化错误时，将错误数据和格式化指令传递给大模型，让 LLM 进行相关修复

Pasted image 20241110131945.png

重试解析器，错误时重新向大模型发起查询并附带更多指导信息，可修复完整性、准确性等问题

与自动修复解析器相比，自动修复解析器只能修复格式上的错误，重试解析器通过重新请求生成可以修复内容上的错误，如缺项等