Pinecone向量数据库推出专用节点,支持更高要求工作负载

6 阅读4分钟

Pinecone向量数据库推出专用读取节点,支持更高要求工作负载

向量数据库初创公司 Pinecone Systems Inc. 近日宣布推出一项新的高性能部署选项,以满足需要支持最苛刻企业用例的客户需求。

该选项名为“专用读取节点”(DRN),目前正处于公开预览阶段。它为客户提供了预留容量,以实现低延迟查询,并带来可预测的性能和成本。该公司解释称,DRN使其能够支持更广泛的、具有极端且多变性能要求的用例。

Pinecone是先进向量数据库的创建者,该数据库能够动态存储、转换和索引数十亿个高维数据点,从而快速、准确地响应诸如最近邻搜索之类的查询。

与按行和列存储数据的关系型数据库不同,向量数据库将非结构化数据表示为高维数据点,每个数据点代表一个向量或数字数组。向量数据库的主要功能之一是执行相似性搜索,可以使用余弦相似性或欧几里得距离等度量方法,快速找到与给定查询向量最相似的向量。向量数据库被视为人工智能工作负载的关键,因为大型语言模型需要快速访问大量非结构化数据。

在一篇博客文章中,Pinecone 解释道,人工智能系统具有复杂的需求。某些应用程序,例如 RAG(检索增强生成)、AI智能体、模型原型和预定作业,具有“突发性”工作负载。这些负载大部分时间保持较低且稳定的流量,但在查询量激增时会突然活跃起来。对于此类情况,Pinecone 标准的按需数据库是理想选择,它结合了简单性、弹性和基于使用量的定价。

然而,有些应用需要持续的高吞吐量,在更大规模上运行,并且对延迟极其敏感。例如,十亿向量级的语义搜索、实时推荐系统以及具有严格服务水平目标的面向用户的助手,都要求更一致的性能水平,以及可预测的大规模成本。

不受限的更好性能

这正是 Pinecone 引入 DRN 的原因。这是一种新的部署选项,查询在隔离的、预配置的专用节点上运行,专用于此类工作负载。通过这些节点,数据在系统内存和本地固态硬盘中保持“温热”状态。

这意味着可以快速访问数据,无需经历“冷启动”。冷启动是由于需要先从对象存储中获取信息而导致的。由于节点专用于每个工作负载,因此不存在“吵闹邻居”、共享队列或查询限制的问题。

DRN 在两个维度上进行扩展:通过副本确保最大吞吐量和可用性以提高弹性,并使用分片来扩展存储容量。用户可以根据需要添加任意数量的副本和分片,以确保其工作负载能够扩展。为确保成本可预测,定价基于每个节点每小时费率。

Pinecone 表示,客户将受益于尽可能低的延迟和保证的高吞吐量,从而为高每秒查询数工作负载确保更一致的性能。DRN 还可以无限扩展,该公司进一步声称,与基于每次请求定价模型的按需节点相比,客户将看到更低、更可预测的成本。

DRN 是针对最苛刻用例的部署选项,适用于那些需要性能隔离、在重负载下可预测的低延迟以及随着需求增长而线性扩展的公司。除了十亿向量级搜索和推荐系统外,DRN 还可用于关键任务的AI应用、需要隔离以防止一个工作负载影响另一个工作负载的大型企业或多租户平台,以及其他需要大规模性能的应用。

Pinecone 表示,其 DRN 已在真实条件下为多家早期采用者证明了可靠性。一位客户正在使用 DRN 支持其设计平台上的元数据过滤实时媒体搜索,能够在1.35亿个向量中维持每秒600次查询的性能,延迟仅为45毫秒。同一客户还对其进行了极限测试,在一次负载测试中,其节点达到了令人印象深刻的每秒2,200次查询,P50延迟仅为60毫秒。

在另一个例子中,一位运营大型电子商务市场的客户将其推荐引擎部署在 Pinecone 的 DRN 上,以支持在拥有14亿个向量的数据库中,每秒处理5,700次查询,P50延迟仅为26毫秒。

图片:某机构/Meta AI