一句话,让三个 AI 同时开工:OpenAkita 开源多 Agent 助手解析

0 阅读5分钟

大多数人用 AI 的方式还是一问一答——你打字,它回答,换个问题再来一遍。OpenAkita 想做的是另一件事:多个 AI 自动组队分工,你说一句话,后面的事它们自己搞定。这个项目刚开源没多久,但设计思路值得认真看一下。

一个 AI 团队,不是一个 AI 聊天框

A 先说最核心的功能:多 Agent 协作。

你说"帮我做一份竞品分析报告",普通 AI 助手会告诉你它做不了,或者给你一堆需要你自己整理的文字。OpenAkita 的做法是把这个任务拆开——搜索 Agent 去找竞品资料,分析 Agent 处理数据,写作 Agent 负责出报告,三个 Agent 同时跑,各司其职,最后把结果汇总给你。

多 Agent 协作流程

这不是噱头。架构层面,它有一个 AgentOrchestrator 做总调度,下面是 AgentInstancePool 管 Agent 实例,支持最多 5 层委派深度,防止任务递归失控。每个 Agent 的工作状态都能在神经网络仪表盘实时看到。

遇到卡住的任务,它会自动切换策略,而不是直接告诉你"我不行"。ReAct 推理机制是底层逻辑:思考 → 行动 → 观察,三阶段显式循环,有 Checkpoint 机制,失败了能回退。

系统架构:从对话框到 AI 团队

OpenAkita 的架构分 6 层,从桌面 App 一路往下到各个 IM 平台:

系统架构图

最上层是 Tauri + React 构建的桌面 App,下面依次是推理引擎、Agent 调度层、记忆系统、工具层,最底层对接 6 个 IM 通道。每一层都有明确的职责边界,不是把所有逻辑堆在一个大文件里。

89 种工具,能做的事比你想象的多

多 Agent 是分工机制,但每个 Agent 具体能干什么,取决于内置工具的能力。

89+ 内置工具,16 大类别

OpenAkita 内置 89 种工具,覆盖 16 个类别。几个能直接感受到差异的场景:

  • 设置一个每天早上 9 点搜集竞品动态发到钉钉群的任务,自动执行
  • 在 Telegram 发语音消息指挥它干活,识别后直接执行
  • 让它打开 Excel 填数据,它真的去操作桌面

这类"做事"能力,和普通 AI 助手的差距不是大一点,是本质不同。

还有个 Plan Mode:复杂任务自动拆成步骤,每步都有进度条,某步卡住了自动回退换方案。不是黑盒,随时能看到走到哪里了。

零命令行,这一点很关键

同类开源 AI 助手的上手门槛普遍偏高。要装 Python、要 git clone、要改 yaml 配置文件,劝退了大量有兴趣但不是程序员的用户。

OpenAkita 把这个流程改了:下载安装包 → 双击安装 → 打开向导 → 填 API Key → 开始用。

零命令行 vs 传统配置对比

下面是官方的配置向导实际界面截图:

桌面引导向导界面

配置完成,开始对话

全程没有命令行,Python 运行时自动隔离,不影响你系统里已有的环境。官方给出的时间:5 分钟从安装到对话。

配套桌面 App 有 11 个功能面板,全图形化操作:

桌面 App 主界面

30+ 大模型 + 6 个 IM 平台

模型这块没有绑定。DeepSeek、通义千问、Kimi、Claude、GPT、Gemini,国内外主流提供商都支持,用自己的 API Key,一个模型挂了会自动切到备用。

IM 平台接入是另一个亮点:飞书、企微、钉钉、Telegram、QQ、OneBot,在你常用的聊天工具里直接 @ 它,发语音也能识别。不需要单独开一个 App,在群里就能用。

平台接入方式特点
飞书WebSocket / Webhook卡片消息、事件订阅
企微Smart Robot流式回复、主动推送
钉钉Stream WebSocket不需要公网 IP
TelegramWebhook / Long PollingMarkdown 输出、代理支持
QQWebSocket / Webhook群聊、私聊、频道
OneBotWebSocket兼容 NapCat / Lagrange

它真的记得你

记忆系统是很多 AI 助手的弱点——聊完就忘,每次都要重新介绍自己。

三层记忆系统

OpenAkita 做了三层记忆:工作记忆(当前任务上下文)、核心记忆(用户画像和偏好)、动态检索(历史经验),支持 7 种记忆类型。两个月前告诉它你喜欢简洁风格,现在写东西它还记得。

还有 8 种人格预设:默认、技术专家、男友模式、女友模式、Jarvis 管家、管家、商务、家庭。一句话切换。三小时没理它,它会主动来问你在忙什么。

数据安全和自我进化

数据全部本地存储,不上传云端。配了 POLICIES.yaml 做策略引擎,危险操作需要用户确认,有资源预算控制,运行时能检测死循环。

有意思的一个机制:每天凌晨 4 点,它会分析自己的错误日志、做 AI 诊断、尝试自动修复,发现缺少某个技能时,自动去 GitHub 搜索或让 AI 现场生成一个。

Apache 2.0 开源,代码完全公开。

功能演示

(演示视频 1:多 Agent 协作实际运行效果——待填入)

(演示视频 2:零命令行安装上手全流程——待填入)

(演示视频 3:IM 平台接入演示——待填入)

当前状态和获取方式

项目刚发布,目前版本 v1.25.0,758+ 次代码提交,仍在活跃更新。安装包支持 Windows、macOS、Linux:

github.com/openakita/o…

也可以 pip 安装:

pip install openakita[all]

X 账号 @openakita 有最新动态,Discord 社区:discord.gg/vFwxNVNH

多 Agent 协作这个方向,大公司们都在做,但做成"普通人也能用"的开源版本,目前还不多见。OpenAkita 的思路挺清晰:先把上手门槛打下来,再把 Agent 协作做进去。

对这类项目,最实际的评价方式是自己下载用一轮,看看"89 种工具 + 多 Agent 自动分工"在真实任务里跑得顺不顺。

关键数据

指标数值
版本v1.25.0
代码提交758+
内置工具89+ 种
支持模型提供商30+ 家
接入 IM 平台6 个
预设人格8 种
桌面平台Windows / macOS / Linux
开源协议Apache 2.0

参考链接