本文内容节选自6月13日,由msup和高可用架构联合主办的GIAC全球互联网架构大会,腾讯云向量数据库高级产品经理熊鑫分享的《腾讯云向量数据库助力大模型激活企业数据价值》案例实录。
分享者熊鑫,长期从事向量数据库相关的产品策划工作,推动上线国内首创的“Embedding和AI套件功能”,极大降低客户接入门槛,助力千行百业的企业实现数据接入AI,并持续挖掘更多的数据价值。
目录
• AI时代的数据挑战与向量数据库的崛起
• 腾讯云向量数据库2.0的能力升级与实践
• DB For AI 的展望和规划
演讲全文
在AI浪潮席卷全球的当下,如何有效管理和利用海量数据,成为企业面临的核心挑战。腾讯云向量数据库正是为解决这一挑战而生,致力于成为连接大模型与企业数据价值的“枢纽”。
01
AI时代的数据挑战与向量数据库的崛起
数据正以前所未有的速度增长,据IDC预测,2025年全球数据量将达175ZB,其中非结构化数据占据绝对主导。与此同时,Gartner预测2026年将迎来向量数据的爆发式增长。这要求企业必须找到高效处理非结构化数据的方法。
传统上,企业依赖结构化数据(存储在关系型数据库如TDSQL-C中)构建业务。而非结构化数据则多存储于对象存储等介质。结构化数据具有逻辑关系,易于查询;非结构化数据则形态多样,蕴含丰富信息但难以直接利用。
向量数据库应运而生。其核心能力在于:
• 非结构化数据检索:通过Embedding模型将文本、图片、音视频等转化为向量存储,并基于相似性检索快速找到最相关结果。
• 大模型的海马体与实时知识库:为预训练的大模型提供实时更新的背景知识(毫秒级更新能力),弥补其无法感知实时变化的不足。
• AGI时代的“数据枢纽”:整合企业内部分散的非结构化数据,打破数据孤岛,解决数据不可检索问题,为搜索、智能推荐等应用系统提供全面升级的基础,并结合大模型能力,催生更智能的Agent应用。
以微信支付消费查询功能为例,过去用户想要查询某个月份的网上购物消费金额,需要自行进行手动查询,如日期范围(6 月 1 日至 6 月 30 日)与消费类别(网上购物),然后进行繁琐的筛选与求和操作。然而,借助向量数据库将相关数据转化为向量并进行存储后,用户只需以自然语言的形式向 Agent 应用发出查询指令,例如直接询问 “我 6 月份网上消费花了多少钱”,Agent 应用便能够迅速从向量数据库中检索出用户的背景数据,并结合模型的推理能力,为用户提供更精准、更便捷的答案。这一转变不仅提升了用户体验,也充分体现了向量数据库在 Agent 时代作为数据枢纽的关键作用,它有效地连接了用户需求、数据与 AI 应用,打造了一个智能化、便捷化的交互生态。
02
腾讯云向量数据库2.0:能力升级与实践探索
腾讯云向量数据库源自腾讯集团自研的OLAMA向量检索引擎,自2019年上线至今,经过6年打磨,集团内部已有100+业务线上使用,覆盖搜索、推荐、AI场景,日均处理超8500亿次检索请求。
它在数据安全、性能成本、应用型等方面进行了全方位的升级与实践探索,为企业在 AI 时代的数据处理与利用提供了强大的技术支撑。
2.0版本核心能力升级:效果跃升与企业级增强
腾讯云向量数据库2.0的核心能力升级,聚焦于检索效果的突破与企业级能力的完善,以应对AI时代的数据挑战。在检索效果方面,2.0版本实现了混合检索(Hybrid Search)的重大革新。针对单纯向量检索在特定场景(如电商数字匹配、短文本识别)的局限性,2.0版本支持的原生双路混合检索架构,将稠密向量检索与稀疏向量(关键字)检索相结合。稠密向量检索能够提供跨模态语义搜索能力,支持多语言理解与输入容错,例如能够召回与“绿牌车补贴政策”等近义内容相关的结果;而稀疏向量检索则实现了精确关键词匹配,能够精准命中包含“新能源车补贴申请”等关键词的政策文档。这种双路融合的方式显著提升了RAG、搜索等场景的召回率与准确性。
以真实客户案例为例,在电商场景中,“iPhone 15 Pro”的检索误召率(如混淆iPhone 12)通过混合方案降至5%以下,召回效果突破95%。此外,重排序功能进一步优化了检索结果,支持权重融合(如70%向量+30%关键字)、RRF(倒数排名融合)等多种策略,并且未来将集成模型重排能力,实现更智能的结果排序,从而为企业提供更精准、更高效的检索体验。
围绕安全、性能、成本、易用性四大核心需求,2.0版本推出20+企业级特性
(一)数据安全保障
在数据安全层面,腾讯云向量数据库 2.0 继承了云上数据库的优秀特性,提供了完善的数据备份与恢复能力。它能够确保在面对各种意外情况时,数据的完整性和可用性得到妥善保障,用户无需担心数据丢失或损坏等问题。此外,腾讯云向量数据库 2.0 还引入了成熟的 RBAC权限管理机制,对不同用户角色的权限进行精细划分与严格管控,这使得企业能够根据员工的职责与工作需求,为其分配相应的数据访问与操作权限,最大限度地降低数据泄露与误操作的风险,在最底层的存储层面,该数据库具备 99.99% 的SLA保障,为企业的数据存储与业务运行提供了坚实可靠的基石,确保了企业存储的数据安全可靠。
(二)性能优化与成本控制
性能方面,腾讯云向量数据库 2.0 在索引层面进行了深度优化。目前,客户使用向量数据库的索引主要采用 HNSW索引。HNSW 索引是一种基于内存图结构的高效索引,它通过构建多层图来实现快速的相似性搜索。然而,传统的 HNSW 索引在面对大规模数据量时,可能会面临插入效率下降、删除操作导致的图重组开销增大以及过滤条件带来的性能瓶颈等问题。
为了解决这些问题,对 HNSW 索引进行了深入的优化,引入了一系列创新性的算法与策略,使得索引性能相比之前提升了 1.5 倍。通过优化索引的构建与更新机制,大幅提高了数据插入与删除的效率,降低了因数据变动而导致的图重组开销。同时,针对过滤条件场景,开发了专门的 Filter 处理器。当过滤条件导致符合条件的数据量占底库数据量的比例极低(如 1% 以下)时,Filter 处理器能够智能地触发优化逻辑,将检索过程退化为 暴力检索模式。这种优化策略使得在特定场景下的检索性能得到了百倍的提升,极大地提高了系统的响应速度与效率。
在成本控制方面,腾讯云向量数据库 2.0 同样展现出了卓越的优势。首先,2.0版本支持了 BF16/FP16 量化技术,能够对 HNSW 索引进行有效的压缩。原本存储在内存中的向量数据采用该类格式后,内存使用量可降低至原来的一半,从而显著降低了企业的成本。其次,该数据库还对 IVF系列索引进行了优化,使其能够在大规模数据集上有效地降低存储成本,为企业应对海量数据提供了经济高效的解决方案。
此外,为了进一步提升系统的扩展性与性能,腾讯云向量数据库后续还将支持 Shard 水平扩展功能。通过合理的架构设计与资源分配策略,使得数据库能够轻松应对业务增长带来的数据量与并发访问量的增加,确保了企业在业务发展过程中,其数据处理系统能够具备良好的弹性和可扩展性。
(三)易用性提升
在易用性方面,腾讯云向量数据库 2.0 提供了丰富的功能与特性,以满足不同业务场景下的多样化需求。例如,它支持二进制索引,这使得在处理特定类型的数据时能够更加高效便捷。同时,该数据库还引入了动态标量索引功能,允许用户在业务运行过程中灵活地新增或修改标量索引字段,而无需事先定义严格的表结构。这种灵活性极大地提高了数据库的适应性与易用性,使得企业在面对快速变化的业务需求时,能够迅速调整数据存储与检索策略。
2.0版本核心上线了 20 多种产品能力,通过不断更新与优化功能特性,全面提升了整个数据库的企业级服务能力和用户体验,使得企业能够更加轻松地拓展全球市场,开展跨国业务。
03
DB for AI:展望与规划
腾讯云致力于打造一站式RAG数据解决方案,核心围绕Index(索引)、AI Operator(算子)和Data Integration(数据集成) 展开:
(一)Index(索引)层面
在索引层面,腾讯云向量数据库 2.0 提供了多种类型的索引,包括 Flat、HNSW、IVF及 DiskFlat ,以适应不同业务场景下的数据规模、召回率、成本与性能等多方面需求。
**• FLAT:**暴力检索,100%向量召回率,适用于小规模强召回率场景。但计算开销巨大(需全量比对)
**• HNSW:**基于内存多层图,在百万至亿级规模下平衡检索效率与召回率(80%-99.99%)
**• IVF系列:**基于聚类,适用于超大规模(亿级+)。写入快,通过量化(PQ等)可降低存储成本50%-75%。召回率80%-100%。
**• DiskANN/DiskFlat:**核心索引存储于磁盘,内存仅存缩小图。内存占用<25%,成本对比内存索引可降90%,适用于大规模、低QPS、多租户场景(如知识库应用),召回率80%-99.9%/100%。
(二)AI Operator(算子)层面
在 AI Operator 层面,后续将支持 document AI Operator 和 Deep search Operator,以提升数据处理与检索的智能化水平。
Document AI Operator 主要专注于解决企业内部非结构化数据(如 PDF、Word 文档等)向量转换的难题。它整合了腾讯内部多个团队的技术优势,打造了一套完善的解决方案。该方案能够有效应对文档内容识别、拆分以及翻译等多方面的挑战。例如,在处理 PDF 文档时,它能够准确识别文档中的双列布局、图像中的文字信息(如饼状图中的类别与百分比数据)等复杂内容,并将其转换为自然语言描述,从而最大限度地保留原始文档的语义信息与数据完整性。此外,针对长文档(如成百上千页的企业文档)的处理,Document AI Operator 提供了内容识别以及 Chunk Splitter(分块拆分器)等功能,使得文档内容能够符合 Embedding 模型的输入窗口长度要求,进而实现对长文档的高效向量化处理。
Deep search Operator 则借鉴了人类在互联网检索信息时的拟人化搜索行为。它通过引入意图识别模型和多轮 Query 改写模型,对检索过程进行智能化的优化与迭代。当一次检索结果不理想时,Deep search Operator 能够根据用户的检索意图,自动调整检索关键词,补充更多的语义信息,从而在多次检索的过程中逐步提升检索效果,为用户提供更精准、更全面的搜索结果,极大地提高了用户获取所需信息的效率与满意度。
(三) interface(接口)层面
在接口层面,腾讯云向量数据库 2.0 提供了多样化的调用方式,以满足不同业务场景下的需求。用户既可以通过直接使用向量数据库的 API进行编程调用,将数据库的检索与分析能力无缝集成到自己的应用系统中;也可以利用原始数据库集成方式,实现更快速、更便捷的功能集成。这种多样化的接口设计使得企业能够根据自身的技术架构与业务需求,灵活选择最合适的数据访问方式,从而加速 AI 应用的开发与部署,提升企业的数据驱动创新能力。
01
未来展望:构建数据与 AI 的融合生态
在企业数据处理的未来蓝图中,主要提出了两种主要的发展方向与架构设想,旨在构建更加完善的数据与 AI 融合生态。
一方面,企业可以利用腾讯云数据库强大的数据处理能力,构建一个统一的 AI 数据平台。在这个平台上,多元异构的数据源中的数据能够通过数据订阅的方式被集中抽取与整合。然后,借助 AI Operator 与索引构建能力,将这些数据转化为高效的向量索引,并存储在向量数据库中。最终,企业可以通过向量数据库作为核心出口,为上层的 RAG 应用、Agent 应用等 AI 应用提供统一的数据服务与智能支持。这种架构模式能够实现企业数据的集中管理与高效利用,为企业的 AI 战略提供坚实的数据基础。
另一方面,也提出了一种更为灵活、渐进式的融合方案。在这种方案中,企业现有的数据存储与检索路径保持不变,如继续使用 MySQL、PostgreSQL(PG)、MongoDB 等传统数据库。同时,在底层引入数据订阅机制,将这些数据库中的数据同步到向量数据库中,并构建相应的向量索引。在数据查询时,系统会根据应用的需求,同时从传统数据库和向量数据库中进行检索,并将结果进行融合与优化。这种双路召回的机制不仅保留了传统数据库在结构化数据处理方面的优势,还充分发挥了向量数据库在非结构化数据检索方面的特长,从而为企业提供了一个多路融合的 RAG 解决方案。它能够在不打破企业现有 IT 架构的基础上,为企业现有的数据处理流程注入新的活力,实现数据与 AI 的紧密融合,助力企业逐步迈向智能化转型的新征程。
综上所述,腾讯云向量数据库2.0通过混合检索、企业级增强能力,以及面向未来的DB for AI规划,致力于成为企业激活非结构化数据价值、构建高效RAG应用和智能Agent的核心基础设施。我们期待与您携手,在AI时代共同挖掘数据的无限潜能,助力企业智能化升级。
以上内容来自熊鑫老师的分享。