随着大模型技术的普及,企业搜索正从传统的“关键词匹配”向“智能体交互式搜索”演进。如何在不牺牲稳定性与成本可控的前提下,实现搜索能力的智能化升级,成为企业数字化转型的关键命题。
2026年4月18日,由 Elastic 主办、阿里云作为钻石赞助商支持的 “Unlock the Power of Search AI —— Elastic 中国 AI 搜索技术大会” 在北京成功举行,参会人数近400人。阿里云智能集团计算平台事业部多位AI搜索技术与产品专家出席,围绕 Agent Native架构、向量混合检索实战、云端存算分离与降本增效、Agentic RAG 等核心议题,与企业客户深入探讨了 Search AI 的技术落地与商业价值。
一、 产品进阶:定义 Agent 时代的搜索新范式——从“人找信息”到“知识记忆湖”
阿里云智能集团计算平台事业部 AI 搜索负责人邢少敏在《从企业搜索到AI搜索Token化:阿里云 Elasticsearch 的云产品进阶之路》中指出,随着大模型应用进入 Harness Engineering 阶段,搜索的核心价值已从服务于人类查找信息,转变为服务于 Agent 获取上下文,成为Agent上下文工程(Context Engineering)与记忆管理的核心组件。
1. Agent 原生的搜索体验
传统搜索引擎为人类设计,图形界面,搜索结果列表用于点击浏览,而阿里云 Elasticsearch 正在重构搜索体验,为 Agent 重新设计搜索引擎:
-
原生 Agent 支持: 阿里云Elasticsearch原生支持Agent创建,编排和使用,可以创建各类Agent 用于ES的运维管理、数据检索和分析。
-
Agentic Search: 阿里云Elasticsearch 原生支持Agentic Search,将原来面向人的搜索结果转变为面向Agent,搜索结果为JSON、Markdown 等适合AI阅读的格式,让 Agent 能高效读取与执行,同时节省token消耗。
-
Agentic数据处理: 阿里云Elasticsearch 将原生支持Agentic 多模态数据离线处理,内置的多模态数据处理Agent会将用户可以以自然语言描述的多模态数据处理需求转化为 离线任务运行,处理完成后再构建索引。
-
全生命周期 Skills:将阿里云Elasticsearch的实例创建、集群配置、集群运维、健康诊断、监控和告警等全生命周期抽象为 通用Skills,允许不同的Agent使用阿里云Elasticsearch,比如悟空、QoderWork,Dataworks Data Agent,还有开源的OpenClaw等。阿里云Elasticsearch 成为 Agent 连接数据世界的统一网关,支持Agent直接创建实例,管理索引,运维集群、数据分析等,大幅降低使用门槛。
2. 构建企业级“知识记忆湖”
邢少敏提出,阿里云 Elasticsearch 应演变为 Agent 的长期记忆、技能和知识库存储引擎。通过 Agentic Search 架构,阿里云 Elasticsearch 不仅能存储交互日志,用户偏好与 Skills,还能沉淀企业知识。这种“越用越懂你”的记忆机制,能有效减少 LLM Token 消耗,提升任务成功率,并依托全模态数据湖仓架构打破企业信息孤岛。
3. 高性能底座支撑
底层依托自研 FalconSeek 引擎,实现向量查询性能提升 50%-300%,并结合 GPU 加速与 BBQ 量化,确保在千亿级数据规模下,仍能为 Agent 提供毫秒级的上下文检索响应。
二、 最佳实践:千亿级 AI 搜索的效能突破与架构演进
面对 AI 搜索大规模落地中的效果瓶颈与高昂成本,AI搜索成为Agentic产品的关键组件 ,阿里云智能集团计算平台事业部 AI 搜索产品负责人汤祯捷在《搜索即智能体:千亿级 AI 搜索的效能实践》中,分享了客户实践中的三大核心突破:
1. 混合检索 2.0:原生一体化融合检索,解决“召回不准”难题
针对传统向量检索在过滤场景下的失效问题,阿里云推出 智能混合检索(Hybrid Retrieval 2.0):
-
原生一体化联合检索:多路召回 + RRF 融合的统一架构。不再是两个独立引擎拼在一起,而是在一个统一的检索框架内做多路召回。
-
边检索边过滤:在 KNN 搜索过程中直接应用过滤器并设定相似度阈值,彻底解决“过滤后结果为空”的工程痛点。
-
动态 RRF 融合:通过语义感知的动态权重调整与学习型稀疏检索(LSR),无需手动调参即可实现多路召回的高质量融合,显著提升长尾知识的召回准确率。
2. 极致效能:逻辑冷热索引分层与存储降级,TCO 降低 40%-70%
为打破千亿级数据下的算力瓶颈,阿里云创新提出 “逻辑冷热索引分离” 策略:
-
资源精准分配:仅对 10% 热数据构建高性能 HNSW 索引,90% 冷数据采用低开销存储,使单节点内存需求暴降 70%,计算规格减半。
-
Ingest Pipeline 实现智能流量路由: 根据文档的更新时间、访问频率、业务重要性等维度,自动路由标记为热索引或冷索引。
-
存储介质降级: 牺牲一部分冗余 IOPS,换来的是 50% 的存储降本和吞吐量的提升。
-
存算分离升级:依托自研内核 FalconSeek 与云端存算分离架构,实现云原生 DSL 查询加速 3 倍以上,整体拥有成本(TCO)降低 40%-70%。
3. 搜索即执行:知识库 RAG 全面拥抱 Agentic RAG
汤祯捷指出,AI 搜索正经历从“信息获取”到“智能体自主执行”的范式转移。借助阿里云ES的基础底座,结合Search Agent核心能力与Agentic RAG引擎,搭建Agentic Search + 阿里云ES的全新AI智能体产品。支持多模态检索与结构化索引,为企业构建可度量、可调度的多 Agent 协作体系, 实现DeepResearch, 联网搜索,知识库RAG,自主执行等AI典型任务。
**Agentic RAG——AI搜索即智能体的实践应用。**Agentic RAG引擎实现三位一体索引库(文本/向量/结构化索引目录)能力,应用在AgenticSearch 知识库内。并支持Agentic Search持续学习:检索结果的质量反馈回来,用于优化索引;索引的更新反过来提升检索效果。这是一个闭环。
三、 技术深潜:破解 AI 搜索“效果与成本”双重难题的最佳实践
阿里云智能集团计算平台事业部 AI 搜索高级技术专家吴作栋在《向量混合检索最佳实践》中,分享了从算法优化到架构升级的系统性解法:
1. 成本效益:BBQ 量化与存算分离
针对百亿级向量场景,阿里云推出 BBQ(Better Binary Quantization)量化技术,通过非对称量化将向量数据压缩至极致。实测显示,100亿向量数据的存储节点可从 225 台缩减至 11 台,资源节约高达 95%。结合 OpenStore 存算分离架构,整体 TCO 降低 40% 以上。
2. 性能提升:自研 FalconSeek 引擎
基于 C++ Native 构建的 FalconSeek 云原生引擎,消除了 JVM GC 抖动,实现 DSL 聚合查询加速 6.8 倍、带过滤向量查询吞吐提升 3-5 倍。同时,通过 Retrievers 声明式检索框架,一键编排 BM25、kNN 多路召回与 RRF 融合排序,兼顾关键词精确匹配与语义理解。
3. 落地路径:三步走策略
吴作栋建议企业采用 “快速搭建(BM25+kNN+RRF)→ 效果优化(接入百炼 Embedding/Rerank+BBQ 量化)→ 极致性能(FalconSeek 引擎+存算分离)” 的三步走路径。该方案已成功支撑 金山文档千亿级语义搜索 及某大模型公司大规模 C 端实时检索。
四、 生态协同:构建 Agent Native 的开放搜索底座
本次大会不仅是技术的交流,更是生态的聚合。阿里云与 Elastic 深度协同,通过 官方ES Skills、云原生架构增强、全链路可观测 三大维度,共同构建面向 Agent 时代的开放搜索生态系统。
-
首发 ES Skills,赋予 Agent 原生执行力
阿里云 Elasticsearch 正式发布 ES Skills 功能,将实例管理、集群诊断、索引管理、数据查询等核心能力封装为标准化工具集。多种主流AI Agent 都可通过自然语言直接发现并调用这些ES Skills,实现从“被动检索”到“主动执行”的跨越。 -
云原生架构增强,实现极致弹性与合规
在兼容 Elastic 最新特性(如 Vector Search、ML Nodes)的基础上,阿里云增强了 OpenStore 存算分离架构 与 Serverless 能力,支持按需付费与秒级扩缩容。 -
全链路可观测,降低运维复杂度
通过集成 CloudLens For ES,实现了从基础设施层(CPU/内存/磁盘)到应用层(慢查询、健康事件、向量检索延迟)的全链路监控。结合智能告警与根因分析功能,帮助运维团队从“被动救火”转向“主动预防”,保障 AI 搜索业务的高可用性(SLA)。
五、 未来演进:从 RAG 到 Agentic Search,重塑企业知识资产
随着 AI 技术从“ Prompt Engineering”, 到“Context Engineering”, 向长时间运行的“Harness Engineering”演进,阿里云 Elasticsearch 的战略重心已从单纯的“搜索引擎”转向 “Agent 的智能记忆与AI搜索基础设施”升级。未来,我们将持续深化以下三个方向的投入:
1. AI搜索演进:打造“知识记忆湖”Agentic Memory
未来的搜索系统将不再仅仅是信息的检索入口,而是企业专属的包含智能记忆库的Agent智能体。
-
记忆沉淀:自动从交互日志中提取用户偏好、对话上下文与执行 Skills,形成结构化与非结构化统一的“知识记忆湖”。
-
越用越聪明:通过记忆机制减少 LLM Token 消耗,提升任务成功率,让 Agent 具备“个性化”与“连续性”的服务能力。
-
Lake Search: 阿里云ES打造基于阿里云OpenLake的全场景联邦搜索。
2. 效能突破:FalconSeek引擎升级与存算分离云架构
-
Serverless 与存算分离:进一步屏蔽底层资源管理细节,实现真正的按需计费与极致弹性,让开发者专注于业务逻辑而非集群运维。
-
GPU 加速向量化:深化 GPU 在向量索引构建、重排序(Rerank)及推理环节的加速应用,结合 BBQ 量化技术,在千亿级数据规模下保持毫秒级响应与极致低成本。
3. 行业深耕:专属化与一体化解决方案
-
行业专属实例:针对金融(高合规)、电商(高并发)、媒体(多模态)等行业,推出预置最佳实践参数的专属搜索实例。
-
搜推问一体:推动搜索、推荐与问答能力的融合,构建支持多模态(文本/图片/视频)检索与复杂工作流编排的一体化平台,助力企业从“数字化”迈向“智能化”。
阿里云致力于通过 稳定、高效、智能且成本可控 的AI搜索基础设施,成为企业构建下一代 AI Agent 应用的最坚实底座,助力客户在 AI 浪潮中实现业务的可持续增长。
关于阿里云 Elasticsearch
阿里云 Elasticsearch 是基于开源 Elasticsearch 构建, 支持 Elasticsearch 企业版的全托管AI搜索云服务,提供高可用、高性能、高安全的搜索与数据分析能力。深度融合阿里云 AI 技术栈,支持向量检索、机器学习节点、Serverless 架构及 MCP 协议,助力企业轻松构建新一代 AI 搜索与 Agent 应用。
了解更多:
阿里云Elasticsearch:www.aliyun.com/product/big…
阿里云AgenticSearch: help.aliyun.com/zh/open-sea…