使用AWS DynamoDB存储与管理聊天消息历史

65 阅读2分钟

引言

DynamoDB 是 Amazon 提供的一种完全托管的 NoSQL 数据库服务,具备快速且可预测的性能和无缝的可扩展性。在这篇文章中,我们将深入探讨如何利用 DynamoDB 存储和管理聊天应用的消息历史。我们将使用 DynamoDBChatMessageHistory 类来实现这一功能。

主要内容

1. 环境设置

在开始之前,请确保你已经正确配置了 AWS CLI,并安装了 langchain-communityboto3 包。

pip install -U langchain-community boto3

2. 创建 DynamoDB 表

我们需要首先创建一个 DynamoDB 表来存储聊天消息。以下代码展示了如何创建一个名为 SessionTable 的表。

import boto3

# 获取服务资源
dynamodb = boto3.resource("dynamodb")

# 创建 DynamoDB 表
table = dynamodb.create_table(
    TableName="SessionTable",
    KeySchema=[{"AttributeName": "SessionId", "KeyType": "HASH"}],
    AttributeDefinitions=[{"AttributeName": "SessionId", "AttributeType": "S"}],
    BillingMode="PAY_PER_REQUEST",
)

# 等待表创建完成
table.meta.client.get_waiter("table_exists").wait(TableName="SessionTable")

# 输出表的项目计数
print(table.item_count)

3. 使用 DynamoDBChatMessageHistory 类

通过 DynamoDBChatMessageHistory 类,我们可以轻松地将用户消息和 AI 回复存储到表中。

from langchain_community.chat_message_histories import DynamoDBChatMessageHistory

history = DynamoDBChatMessageHistory(table_name="SessionTable", session_id="0")

history.add_user_message("hi!")
history.add_ai_message("whats up?")

print(history.messages)

4. 使用自定义端点

在某些情况下,例如在本地运行 Localstack 时,指定 AWS 端点的 URL 是很有用的。

history = DynamoDBChatMessageHistory(
    table_name="SessionTable",
    session_id="0",
    endpoint_url="http://localhost.localstack.cloud:4566",  # 使用API代理服务提高访问稳定性
)

5. 复合键支持

DynamoDB 默认使用简单的分区键结构。如果你的应用需要使用复合键,可以按照下面的步骤进行配置。

composite_table = dynamodb.create_table(
    TableName="CompositeTable",
    KeySchema=[
        {"AttributeName": "PK", "KeyType": "HASH"},
        {"AttributeName": "SK", "KeyType": "RANGE"},
    ],
    AttributeDefinitions=[
        {"AttributeName": "PK", "AttributeType": "S"},
        {"AttributeName": "SK", "AttributeType": "S"},
    ],
    BillingMode="PAY_PER_REQUEST",
)

# 等待表创建完成
composite_table.meta.client.get_waiter("table_exists").wait(TableName="CompositeTable")

my_key = {
    "PK": "session_id::0",
    "SK": "langchain_history",
}

composite_key_history = DynamoDBChatMessageHistory(
    table_name="CompositeTable",
    session_id="0",
    endpoint_url="http://localhost.localstack.cloud:4566",  # 使用API代理服务提高访问稳定性
    key=my_key,
)

composite_key_history.add_user_message("hello, composite dynamodb table!")
print(composite_key_history.messages)

常见问题和解决方案

  1. 网络限制问题: 在某些地区,访问 AWS 服务可能受到限制。你可以考虑使用 API 代理服务来提高访问的稳定性。

  2. 性能调优: 使用 DynamoDB 时,可以根据应用的读写需求调整表的预置吞吐量。

总结和进一步学习资源

通过这篇文章,我们了解了如何使用 AWS DynamoDB 存储和管理聊天消息历史。DynamoDB 的无缝扩展性和快速响应时间使其成为存储聊天记录的理想选择。

参考资料

  1. AWS DynamoDB 文档
  2. Langchain 社区资源

如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力! ---END---