掌握LangChain对象的保存与加载：不再让API密钥成为难题引言在开发人工智能应用的过程中，我们常常需要保存和加载

引言

在开发人工智能应用的过程中，我们常常需要保存和加载对象，尤其是复杂的模型和配置。在使用LangChain库时，也许你曾遇到过序列化和反序列化的一些挑战。本篇文章将深入探讨如何利用LangChain的内置方法来巧妙地保存和加载对象，并保持跨版本的兼容性。

主要内容

1. LangChain的序列化之道

LangChain提供了一套标准化的方法来序列化对象。通过这些方法，你可以将机密信息（例如API密钥）与其他参数分离开，从而在反序列化时安全地重新加载这些机密信息。此外，LangChain的序列化是跨版本兼容的，这意味着即使LangChain版本更新，你依然可以正确加载旧版本序列化的对象。

2. 如何序列化LangChain对象

LangChain对象通过继承Serializable接口实现JSON序列化，包括消息、文档对象以及多数可运行对象（如聊天模型、检索器及通过LangChain表达式语言实现的链）。

提示：仅在可信的输入下使用LangChain的反序列化功能，这是该功能的测试阶段。

3. 实用的序列化函数

LangChain核心库提供了以下函数用于对象的序列化和反序列化：

dumpd：将对象转换为JSON可序列化的Python字典。
dumps：将对象转换为JSON字符串。
load：从JSON字典加载对象。
loads：从JSON字符串加载对象。

下面的代码展示了怎样与一个简单的LLM（语言模型）链进行交互。

代码示例

from langchain_core.load import dumpd, dumps, load, loads
from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI

# 定义聊天提示模板
prompt = ChatPromptTemplate.from_messages(
    [
        ("system", "Translate the following into {language}:"),
        ("user", "{text}"),
    ],
)

# 创建ChatOpenAI对象
llm = ChatOpenAI(model="gpt-3.5-turbo-0125", api_key="llm-api-key")

# 连接提示模板与模型
chain = prompt | llm

# 序列化为JSON字符串
string_representation = dumps(chain, pretty=True)
print(string_representation[:500])

# 序列化为JSON可序列化字典
dict_representation = dumpd(chain)
print(type(dict_representation))

# 保存到磁盘
import json
with open("/tmp/chain.json", "w") as fp:
    json.dump(string_representation, fp)

在序列化过程中，API密钥等机密信息被隐去。

常见问题和解决方案

当你在不同环境或机器上加载LangChain对象时，可能会遇到API密钥不存在的问题。此时，你可以通过secrets_map参数，将正确的密钥加载到对象中。

# 从字符串加载
chain = loads(string_representation, secrets_map={"OPENAI_API_KEY": "llm-api-key"})

# 从字典加载
chain = load(dict_representation, secrets_map={"OPENAI_API_KEY": "llm-api-key"})

# 从磁盘加载
with open("/tmp/chain.json", "r") as fp:
    chain = loads(json.load(fp), secrets_map={"OPENAI_API_KEY": "llm-api-key"})

总结和进一步学习资源

LangChain的序列化方法不仅提供了更好的数据管理方式，还确保了机密信息的安全性。为了进一步深入学习LangChain，你可以参考以下资源：

参考资料

LangChain官方文档和API参考
OpenAI的GPT模型文档

如果这篇文章对你有帮助，欢迎点赞并关注我的博客。您的支持是我持续创作的动力！