OpenDerisk—多智能体协同实现智能运维

979 阅读4分钟

开发者日常花费大量时间在错误排查、异常定位,BugFix,告警处理,有没有一个AI队友帮我干这些【脏活】? "

  • 痛点:开发者经常需要排查错误、定位异常、告警处理,这些工作耗时、耗力,非常占用实际的开发时间。
  • 洞察:OpenDerisk基于Agent技术,可以实现快速的RCA(根因定位)与修复,极大减少开发者的"脏活",使Coding更Happy。

开源代码

github.com/derisk-ai/O…

智能体角色

在OpenDerisk中,有如下智能体。分别是Devid, Devid承担DevOps的角色,主要是做任务的规划( Planner agent, realizing task goal planning decomposition through LLM)。Kevin的角色是具体根因定位,并生成诊断报告,在诊断报告生成过程中,需要明确给出报告的证据链。Magic是一个代码Agent,可以自己动态编写代码做日志和监控的处理、分析,AI-SRE(DeRisk)主要承担管理者的角色,用来分配任务,并让多智能体协同完成最终的任务。

OpenDerisk中Agent角色

运行效果

如下图所示,是DeRisk在处理一个在线告警事件时,多智能体工作的效果图。 在图中我们可以看到通过不同的智能体共同协作,在经过10轮的深度分析之后,得到了最后的定位结论。

添加图片注释,不超过 140 字(可选)

OpenDerisk

OpenDeRisk AI 原生风险智能系统 —— 724H 应用系统AI数字运维助手(AI-SRE), 我们的愿景是, 为每个应用系统提供一个724H的AI系统数字管家,并能与真人进行协同,724H处理业务问题,形成724H得深度护航与防护网。

特性

添加图片注释,不超过 140 字(可选)

  1. DeepResearch RCA: 通过深度分析日志、Trace、代码进行问题根因的快速定位。

  2. 可视化证据链: 定位诊断过程与证据链全部可视化展示,诊断过程一目了然,可以快速判断定位的准确性。

  3. 多智能体协同: SRE-Agent、Code-Agent、ReportAgent、Vis-Agent、Data-Agent协同工作。

  4. 架构开源开放: OpenDerisk采用完全开源、开放的方式构建,相关框架、代码在开源项目也能实现开箱即用。

架构方案

添加图片注释,不超过 140 字(可选)

采用多Agent架构,目前代码中主要实现了绿色部分部分,告警感知采用的是微软开源的OpenRCA数据集, 数据集的大小解压后在26G左右,我们实现在26G的数据集合上,通过多Agent协同,Code-Agent动态写代码来进行最终根因的分析诊断。

技术实现

  1. 数据层: 拉取Github OpenRCA的大规模数据集(20G), 解压本地处理分析。

  2. 逻辑层:Multi-Agent架构, 通过SRE-Agent、Code-Agent、ReportAgent、VisAgent、Data-Agent协同合作,进行深度的DeepResearch RCA(Root Cause Analyze)

  3. 可视化层: 采用Vis协议、动态渲染整个处理流程与证据链, 以及多角色协同切换的过程。

快速开始

安装 uv

curl -LsSf https://astral.sh/uv/install.sh | sh

安装依赖包

uv sync --all-packages --frozen \
--extra "base" \
--extra "proxy_openai" \
--extra "rag" \
--extra "storage_chromadb" \
--extra "client" \
--index-url=https://pypi.tuna.tsinghua.edu.cn/simple

启动

配置derisk-proxy-deepseek.toml文件中相关的API_KEY, 然后运行下面的命令启动。

注意, 我们默认使用OpenRCA数据集中的Telecom数据集, 你可以通过链接, 或者下述命令进行下载

gdown https://drive.google.com/uc?id=1cyOKpqyAP4fy-QiJ6a_cKuwR7D46zyVe

下载完成后, 修改basic_prompt_Telecom.py文件中的数据集路径为本地绝对路径。

运行启动命令

uv run python packages/derisk-app/src/derisk_app/derisk_server.py --config configs/derisk-proxy-deepseek.toml

访问

打开浏览器访问 http://localhost:7777

添加图片注释,不超过 140 字(可选)

致谢

OpenDeRisk-AI 社区致力于构建 AI 原生的风险智能系统。🛡️ 我们希望我们的社区能够为您提供更好的服务,同时也希望您能加入我们,共同创造更美好的未来。