开源向量数据库初创公司 Qdrant Solutions GmbH 今日宣布,已筹集 5000 万美元的早期资金,旨在为更智能、响应更迅速的人工智能应用铺平道路。
AVP 领投了此次 B 轮融资,参投方包括 Bosch Ventures、Unusual Ventures、Spark Capital 和 42CAP。迄今为止,该公司已累计获得 8780 万美元资本,其中包括 2024 年初由 Unusual Ventures 领投的 2800 万美元 A 轮融资。
Qdrant 完全使用 Rust 语言从底层构建,为原本无状态的大语言模型提供基础记忆功能。通常,大语言模型在处理数据时是“一次性”运行的。
向量数据库最初是为了解决一个初始问题而出现的:它们能够检索语义记忆中的最近邻,为大语言模型提供在静态数据中发现上下文的方法。然而,当今的人工智能系统和数据集已截然不同。它们是由动态数据构成的汪洋,其中充满了不断变化的多模态数据源,以及嵌入的文本、图像、音频和视频。
智能体人工智能的出现也改变了智能应用实时检索和使用数据的方式。它不再是迭代的搜索循环,而是一个自由流动的交互过程,在不同上下文、管道、语义搜索、推理和生产级压力的交织下,执行成千上万次查询。
据 Qdrant 介绍,向量搜索的范式需要适应人工智能领域不断变化的需求,这意味着要敢于在暴风雨中直面这片汪洋。
“我们最初称我们的产品为神经搜索引擎。它关乎搜索和信息检索——数据库在这里是一个错误的术语,” Qdrant 首席执行官兼联合创始人 André Zayarni 在接受 SiliconANGLE 采访时表示。
其结果是,搜索引擎需要适应问题,而不是迫使问题去适应工具。系统需要具备可组合性,这意味着模块化和灵活性,以便为手头的工作选择最佳工具集。无论工程团队是想针对最大精度、最低延迟还是规模化的成本效率进行优化,都需要提供可调节的控制项。
Qdrant 将其系统构建为可组合和模块化的,这意味着人工智能团队可以对其进行调整,以适配他们在生产环境中的特定用例。
“所有的用例都是不同的,”Zayarni 说。“它们有不同的需求……有些追求最高质量的结果,而有些公司处理着 TB 级的数据,对他们来说,及时获取这些数据比最终达到 99% 的精度更为重要。”
如今,检索增强生成或 RAG 管道已成为运行聊天机器人和人工智能代理的基本人工智能框架。RAG 利用向量数据库,通过从原始训练数据之外的庞大信息存储中检索特定、权威的知识,来优化大语言模型的输出。该系统对于减少人工智能幻觉(即人工智能模型生成错误)至关重要。一些 RAG 系统由人工智能代理监督,以便将其数据导入其他人工智能代理。
此外,该数据库完全开源,并提供灵活的部署选项,以适应不同的部署阶段。开发者可以在本地机器上的 Docker 容器中将其作为二进制可执行文件(用 Rust 构建)启动以进行快速测试,也可以选择在 Kubernetes 上进行自托管架构、在 Qdrant Cloud 上完全托管,或在混合云或私有云中部署。FINISHED