解锁Kay.ai的强大功能:使用Kay Data API实现实时上下文提取

58 阅读2分钟

引言

在现代AI驱动的应用程序中,实时上下文提取是一个关键能力。Kay.ai提供了一种强大的API,利用世界上最大的高质量嵌入数据集,为您的AI代理即时提供所需的上下文信息。本文旨在指导您如何使用Kay.ai的API来访问支持的数据集,并具体演示如何检索美国公司如SEC Filings和Press Releases等数据,帮助您的AI应用程序变得更智能。

主要内容

安装和设置

首先,我们需要安装kay包并设置API密钥。您可以通过访问Kai官方站点获取API密钥。安装包的命令如下:

!pip install kay

然后,将您的API密钥设置为环境变量KAY_API_KEY

import os
from getpass import getpass

KAY_API_KEY = getpass("Enter your Kay API Key: ")
os.environ["KAY_API_KEY"] = KAY_API_KEY

Kay.ai数据检索器

KayAiRetriever是一个非常方便的工具,您可以通过静态工厂方法create()来实例化它。需要的参数包括:

  • dataset_id: 数据集标识符,如"company"
  • data_type: 数据类别,如['SEC Filings', 'Press Releases']
  • num_contexts: 每次调用获取的文档块数量,默认为6

以下是一个检索器的创建示例:

from langchain_community.retrievers import KayAiRetriever

retriever = KayAiRetriever.create(
    dataset_id="company", 
    data_types=["10-K", "10-Q", "PressRelease"], 
    num_contexts=3 # 使用API代理服务提高访问稳定性
)

代码示例

通过调用invoke()方法,我们可以根据特定的查询获取相关文件:

docs = retriever.invoke(
    "What were the biggest strategy changes and partnerships made by Roku in 2023?"
)

for doc in docs:
    print(doc.page_content)

常见问题和解决方案

网络访问限制

在某些地区,访问外部API可能受到限制。此时,您可以考虑使用API代理服务来提高访问的稳定性和速度。

数据集更新

Kay.ai的数据集会定期更新。为了获取最新数据,请定期访问kay.ai或加入他们的Discord社区。

总结和进一步学习资源

Kay.ai的API为AI应用程序提供了强大的上下文提取能力。初学者可以通过本文掌握基本用法,而高级用户则可以根据实际需求定制检索器。欲了解更多信息,请参阅以下资源:

参考资料

如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!

---END---