博睿数据小睿助理:当 Agentic AI 遇见 Agentic Ops,让运维更加智能
在数字化浪潮席卷各行各业的今天,运维系统的复杂性正以指数级增长。技术人员常常被淹没在告警、指标、日志与配置的海洋中,疲于应对重复性、碎片化的操作任务。我们不禁要问:能否让系统不仅“听得懂”,还能“主动做”?
这正是 Agentic AI 与 Agentic Ops 正在回答的问题。
什么是 Agentic AI?
Agentic AI,即“具备代理能力的人工智能”,是指能够在复杂环境中自主感知、推理、决策并执行任务的智能系统。与传统的大模型问答机器人不同,Agentic AI 不仅仅是被动地回答用户问题,而是像一个真正的“代理”一样:
- 感知环境:理解当前上下文、用户状态、系统状态;
- 规划任务:将复杂目标拆解为可执行的步骤;
- 调用工具:主动使用 API、脚本、查询引擎等外部能力;
- 执行动作:完成具体操作,如生成查询、跳转页面、执行命令;
- 持续学习:根据反馈不断优化行为。
简单来说,Agentic AI 不是“会说话的工具”,而是“会做事的伙伴”。
什么是 Agentic Ops?
Agentic Ops,即“代理式运维”,是将 Agentic AI 的理念引入运维领域所形成的新型运维范式。它强调:
- 从“人被系统驱动”到“系统为人服务” :不再是人去适应系统的复杂逻辑,而是系统主动理解人的意图并代为执行;
- 从“被动响应”到“主动治理” :系统不仅能回答问题,还能预测问题、推荐操作、甚至自动修复;
- 从“多工具切换”到“统一智能入口” :技术人员不再需要在多个控制台之间跳转,而是通过一个智能体完成从诊断到操作的全流程。
Agentic Ops 的目标,是让运维工作从“体力活”变成“创造性工作”。
Agentic AI 与 Agentic Ops 的关系
Agentic AI 是一种能力底座,Agentic Ops 是其在运维领域的具体落地。
- Agentic AI 提供了“智能代理”的通用能力:包括自然语言理解、任务规划、工具调用、记忆与推理等;
- Agentic Ops 则在此基础上,叠加了运维领域的专业知识与操作闭环:如监控指标语义、故障诊断流程、自动化修复策略、权限与安全约束等。
二者相辅相成:没有 Agentic AI,Agentic Ops 无法实现真正的“智能”;没有 Agentic Ops,Agentic AI 也难以在运维场景中发挥真正的业务价值。
小睿助理:博睿数据的 Agentic Ops 实践
在博睿数据,我们将 Agentic AI 的能力注入到 ONE 运维平台中,打造出一款真正“懂你、帮你、替你做事”的智能体——小睿助理。
它不再只是一个问答机器人,而是一个具备代理能力的运维伙伴。你只需用自然语言说出你的需求,小睿助理会像一位经验丰富的运维专家一样,理解你的意图,调用平台能力,完成从信息获取到操作执行的全过程。
小睿助理的核心能力
- 意图识别:精准理解你是想查指标、找页面、看状态,还是执行操作;
- PromQL 自动生成:根据自然语言描述,自动生成准确的 PromQL 查询语句;
- 智能导航:直接带你到达 ONE 平台中你需要的功能页面,无需手动翻找;
- 环境感知:知道你当前在哪个页面、有哪些可操作功能,提供上下文相关的建议;
- 智能问答:结合运维知识库、产品文档、最佳实践,回答各类技术问题;
- 任务执行:在授权范围内,主动执行查询、导出、配置变更等操作。
技术架构:RAG + Agentic 能力
小睿助理的底层采用 RAG (检索增强生成) 架构,结合向量数据库与大语言模型,实现对运维知识的高效检索与精准回答。在此基础上,我们引入了 Agentic 能力层,包括:
- 工具调用引擎:支持调用 PromQL 查询接口、页面跳转 API、配置管理接口等;
- 任务规划模块:将用户的多步需求(如“查一下最近 5 分钟 CPU 高的 Pod,并帮我打开它的监控面板”)拆解为多个可执行步骤;
- 记忆与上下文管理:在多轮对话中保持对用户状态、历史操作、偏好的记忆,实现连贯体验。
其内部流程可以概括为:
- 用户输入 → 意图识别 → 任务规划 → 工具调用 → 结果生成 → 反馈学习
这一流程不仅实现了“回答问题”,更实现了“完成任务”。
典型场景:从“我不知道怎么查”到“已经帮你查好了”
场景一:故障排查
用户:“帮我查一下 order-service 在过去 10 分钟的错误率,按实例分组。”
小睿助理自动生成 PromQL:
text
sum by (instance) (rate(http_requests_total{service="order-service", status=~"5.."}[10m]))
并返回查询结果,甚至主动提示:“是否需要我帮你打开该服务的错误日志视图?”
场景二:平台导航
用户:“全局拓扑图在哪里?”
小睿助理结合页面知识库,返回导航路径并生成跳转链接:
“全局拓扑图位于【观测洞察】→【服务拓扑】页面,[点击此处直达]。”
场景三:新人上手
用户:“什么是黄金指标?”
小睿助理结合可观测性知识库,给出清晰解释,并补充:“在 ONE 平台中,你可以在【业务观测】→【黄金指标】面板查看相关数据。”
总结:让运维回归创造
小睿助理的设计哲学,始终围绕一个核心:让技术人员专注于解决问题,而不是寻找工具。
在 Agentic AI 与 Agentic Ops 的双重驱动下,小睿助理不再是一个“被动的助手”,而是一个“主动的伙伴”。它可以在凌晨三点替你查清告警根因,可以在你忙于故障处理时自动生成查询语句,可以在新人入职时手把手带他熟悉平台。
这不是冰冷的代码,而是有温度的智能。
小睿助理,让运维更简单,让技术更贴心。