深度回顾 | 阿里云携手 Elastic 定义 Agent 时代搜索新范式，解锁 Search AI 核心生产力

随着大模型技术的普及，企业搜索正从传统的“关键词匹配”向“智能体交互式搜索”演进。如何在不牺牲稳定性与成本可控的前提下，实现搜索能力的智能化升级，成为企业数字化转型的关键命题。

2026年4月18日，由 Elastic 主办、阿里云作为钻石赞助商支持的 “Unlock the Power of Search AI —— Elastic 中国 AI 搜索技术大会” 在北京成功举行，参会人数近400人。阿里云智能集团计算平台事业部多位AI搜索技术与产品专家出席，围绕 Agent Native架构、向量混合检索实战、云端存算分离与降本增效、Agentic RAG 等核心议题，与企业客户深入探讨了 Search AI 的技术落地与商业价值。

一、产品进阶：定义 Agent 时代的搜索新范式——从“人找信息”到“知识记忆湖”

阿里云智能集团计算平台事业部 AI 搜索负责人邢少敏在《从企业搜索到AI搜索Token化：阿里云 Elasticsearch 的云产品进阶之路》中指出，随着大模型应用进入 Harness Engineering 阶段，搜索的核心价值已从服务于人类查找信息，转变为服务于 Agent 获取上下文，成为Agent上下文工程（Context Engineering）与记忆管理的核心组件。

1. Agent 原生的搜索体验

传统搜索引擎为人类设计，图形界面，搜索结果列表用于点击浏览，而阿里云 Elasticsearch 正在重构搜索体验，为 Agent 重新设计搜索引擎：

原生 Agent 支持： 阿里云Elasticsearch原生支持Agent创建，编排和使用，可以创建各类Agent 用于ES的运维管理、数据检索和分析。
Agentic Search： 阿里云Elasticsearch 原生支持Agentic Search，将原来面向人的搜索结果转变为面向Agent，搜索结果为JSON、Markdown 等适合AI阅读的格式，让 Agent 能高效读取与执行，同时节省token消耗。
Agentic数据处理： 阿里云Elasticsearch 将原生支持Agentic 多模态数据离线处理，内置的多模态数据处理Agent会将用户可以以自然语言描述的多模态数据处理需求转化为离线任务运行，处理完成后再构建索引。
全生命周期 Skills：将阿里云Elasticsearch的实例创建、集群配置、集群运维、健康诊断、监控和告警等全生命周期抽象为通用Skills，允许不同的Agent使用阿里云Elasticsearch，比如悟空、QoderWork，Dataworks Data Agent，还有开源的OpenClaw等。阿里云Elasticsearch 成为 Agent 连接数据世界的统一网关，支持Agent直接创建实例，管理索引，运维集群、数据分析等，大幅降低使用门槛。

2. 构建企业级“知识记忆湖”

邢少敏提出，阿里云 Elasticsearch 应演变为 Agent 的长期记忆、技能和知识库存储引擎。通过 Agentic Search 架构，阿里云 Elasticsearch 不仅能存储交互日志，用户偏好与 Skills，还能沉淀企业知识。这种“越用越懂你”的记忆机制，能有效减少 LLM Token 消耗，提升任务成功率，并依托全模态数据湖仓架构打破企业信息孤岛。

3. 高性能底座支撑

底层依托自研 FalconSeek 引擎，实现向量查询性能提升 50%-300%，并结合 GPU 加速与 BBQ 量化，确保在千亿级数据规模下，仍能为 Agent 提供毫秒级的上下文检索响应。

二、最佳实践：千亿级 AI 搜索的效能突破与架构演进

面对 AI 搜索大规模落地中的效果瓶颈与高昂成本，AI搜索成为Agentic产品的关键组件，阿里云智能集团计算平台事业部 AI 搜索产品负责人汤祯捷在《搜索即智能体：千亿级 AI 搜索的效能实践》中，分享了客户实践中的三大核心突破：

1. 混合检索 2.0：原生一体化融合检索，解决“召回不准”难题

针对传统向量检索在过滤场景下的失效问题，阿里云推出 智能混合检索（Hybrid Retrieval 2.0）：

原生一体化联合检索：多路召回 + RRF 融合的统一架构。不再是两个独立引擎拼在一起，而是在一个统一的检索框架内做多路召回。
边检索边过滤：在 KNN 搜索过程中直接应用过滤器并设定相似度阈值，彻底解决“过滤后结果为空”的工程痛点。
动态 RRF 融合：通过语义感知的动态权重调整与学习型稀疏检索（LSR），无需手动调参即可实现多路召回的高质量融合，显著提升长尾知识的召回准确率。

2. 极致效能：逻辑冷热索引分层与存储降级，TCO 降低 40%-70%

为打破千亿级数据下的算力瓶颈，阿里云创新提出 “逻辑冷热索引分离” 策略：

资源精准分配：仅对 10% 热数据构建高性能 HNSW 索引，90% 冷数据采用低开销存储，使单节点内存需求暴降 70%，计算规格减半。
Ingest Pipeline 实现智能流量路由： 根据文档的更新时间、访问频率、业务重要性等维度，自动路由标记为热索引或冷索引。
存储介质降级： 牺牲一部分冗余 IOPS，换来的是 50% 的存储降本和吞吐量的提升。
存算分离升级：依托自研内核 FalconSeek 与云端存算分离架构，实现云原生 DSL 查询加速 3 倍以上，整体拥有成本（TCO）降低 40%-70%。

3. 搜索即执行：知识库 RAG 全面拥抱 Agentic RAG

汤祯捷指出，AI 搜索正经历从“信息获取”到“智能体自主执行”的范式转移。借助阿里云ES的基础底座，结合Search Agent核心能力与Agentic RAG引擎，搭建Agentic Search + 阿里云ES的全新AI智能体产品。支持多模态检索与结构化索引，为企业构建可度量、可调度的多 Agent 协作体系，实现DeepResearch, 联网搜索，知识库RAG，自主执行等AI典型任务。

**Agentic RAG——AI搜索即智能体的实践应用。**Agentic RAG引擎实现三位一体索引库(文本/向量/结构化索引目录)能力，应用在AgenticSearch 知识库内。并支持Agentic Search持续学习：检索结果的质量反馈回来，用于优化索引；索引的更新反过来提升检索效果。这是一个闭环。

三、技术深潜：破解 AI 搜索“效果与成本”双重难题的最佳实践

阿里云智能集团计算平台事业部 AI 搜索高级技术专家吴作栋在《向量混合检索最佳实践》中，分享了从算法优化到架构升级的系统性解法：

1. 成本效益：BBQ 量化与存算分离

针对百亿级向量场景，阿里云推出 BBQ（Better Binary Quantization）量化技术，通过非对称量化将向量数据压缩至极致。实测显示，100亿向量数据的存储节点可从 225 台缩减至 11 台，资源节约高达 95%。结合 OpenStore 存算分离架构，整体 TCO 降低 40% 以上。

2. 性能提升：自研 FalconSeek 引擎

基于 C++ Native 构建的 FalconSeek 云原生引擎，消除了 JVM GC 抖动，实现 DSL 聚合查询加速 6.8 倍、带过滤向量查询吞吐提升 3-5 倍。同时，通过 Retrievers 声明式检索框架，一键编排 BM25、kNN 多路召回与 RRF 融合排序，兼顾关键词精确匹配与语义理解。

3. 落地路径：三步走策略

吴作栋建议企业采用 “快速搭建（BM25+kNN+RRF）→ 效果优化（接入百炼 Embedding/Rerank+BBQ 量化）→ 极致性能（FalconSeek 引擎+存算分离）” 的三步走路径。该方案已成功支撑金山文档千亿级语义搜索 及某大模型公司大规模 C 端实时检索。

四、生态协同：构建 Agent Native 的开放搜索底座

本次大会不仅是技术的交流，更是生态的聚合。阿里云与 Elastic 深度协同，通过官方ES Skills、云原生架构增强、全链路可观测三大维度，共同构建面向 Agent 时代的开放搜索生态系统。

首发 ES Skills，赋予 Agent 原生执行力
阿里云 Elasticsearch 正式发布 ES Skills 功能，将实例管理、集群诊断、索引管理、数据查询等核心能力封装为标准化工具集。多种主流AI Agent 都可通过自然语言直接发现并调用这些ES Skills，实现从“被动检索”到“主动执行”的跨越。
云原生架构增强，实现极致弹性与合规
在兼容 Elastic 最新特性（如 Vector Search、ML Nodes）的基础上，阿里云增强了 OpenStore 存算分离架构与 Serverless 能力，支持按需付费与秒级扩缩容。
全链路可观测，降低运维复杂度
通过集成 CloudLens For ES，实现了从基础设施层（CPU/内存/磁盘）到应用层（慢查询、健康事件、向量检索延迟）的全链路监控。结合智能告警与根因分析功能，帮助运维团队从“被动救火”转向“主动预防”，保障 AI 搜索业务的高可用性（SLA）。

五、未来演进：从 RAG 到 Agentic Search，重塑企业知识资产

随着 AI 技术从“ Prompt Engineering”, 到“Context Engineering”, 向长时间运行的“Harness Engineering”演进，阿里云 Elasticsearch 的战略重心已从单纯的“搜索引擎”转向 “Agent 的智能记忆与AI搜索基础设施”升级。未来，我们将持续深化以下三个方向的投入：

1. AI搜索演进：打造“知识记忆湖”Agentic Memory

未来的搜索系统将不再仅仅是信息的检索入口，而是企业专属的包含智能记忆库的Agent智能体。

记忆沉淀：自动从交互日志中提取用户偏好、对话上下文与执行 Skills，形成结构化与非结构化统一的“知识记忆湖”。
越用越聪明：通过记忆机制减少 LLM Token 消耗，提升任务成功率，让 Agent 具备“个性化”与“连续性”的服务能力。
Lake Search: 阿里云ES打造基于阿里云OpenLake的全场景联邦搜索。

2. 效能突破：FalconSeek引擎升级与存算分离云架构

Serverless 与存算分离：进一步屏蔽底层资源管理细节，实现真正的按需计费与极致弹性，让开发者专注于业务逻辑而非集群运维。
GPU 加速向量化：深化 GPU 在向量索引构建、重排序（Rerank）及推理环节的加速应用，结合 BBQ 量化技术，在千亿级数据规模下保持毫秒级响应与极致低成本。

3. 行业深耕：专属化与一体化解决方案

行业专属实例：针对金融（高合规）、电商（高并发）、媒体（多模态）等行业，推出预置最佳实践参数的专属搜索实例。
搜推问一体：推动搜索、推荐与问答能力的融合，构建支持多模态（文本/图片/视频）检索与复杂工作流编排的一体化平台，助力企业从“数字化”迈向“智能化”。

阿里云致力于通过稳定、高效、智能且成本可控的AI搜索基础设施，成为企业构建下一代 AI Agent 应用的最坚实底座，助力客户在 AI 浪潮中实现业务的可持续增长。

关于阿里云 Elasticsearch
阿里云 Elasticsearch 是基于开源 Elasticsearch 构建, 支持 Elasticsearch 企业版的全托管AI搜索云服务，提供高可用、高性能、高安全的搜索与数据分析能力。深度融合阿里云 AI 技术栈，支持向量检索、机器学习节点、Serverless 架构及 MCP 协议，助力企业轻松构建新一代 AI 搜索与 Agent 应用。

了解更多：

阿里云Elasticsearch：www.aliyun.com/product/big…

阿里云AgenticSearch: help.aliyun.com/zh/open-sea…