LuguManus 应用介绍
LuguManus 是一款由 TypeScript 和 Electron 构建的多智能体协作桌面应用。其核心在于利用 AI 大模型协调网络搜索、浏览器自动化操作及本地文件处理等技术,以完成复杂任务。
项目开源地址
-
GitHub:LuguManus GitHub
-
Gitee:LuguManus Gitee
在 AI 浪潮与开源盛行的背景下,LuguManus 仅用 5 天便利用 TypeScript 和 Electron 完成了类 Manus 的雏形。将通用 AI 从 Python 等服务器语言转换为 Electron + TypeScript 这类前端技术,不仅降低了处理网页墙的难度,还为 AI 成为电脑控制器提供了更多可能,使其不再局限于浏览器的沙盒环境。
LuguManus 的主要技术支持
-
Qwen:由阿里提供的多模态大模型,支持文本、编码、图片识别等多种能力。
-
Camel:专注于智能体规模扩展的研究框架。
-
Browser-extension:用于执行浏览器自动化的 Chrome 插件。
LuguManus 具备多代理协作、智能任务分解、工具链集成、响应式数据流、浏览器模拟交互和多模型支持等特性。通过三层代理架构协同解决问题、拆解任务,集成多种工具组件,基于 RxJS 实现流畅的异步消息处理,模拟浏览器行为,支持多种 AI 模型。
整体流程概述
- **协调器(Coordinator) **:
- 系统的核心控制单元,负责管理和协调各智能体的工作,决定任务的分配和流程。
- **任务智能体(Task Agent) **:
- 负责具体任务执行,将任务分解成多个子任务,如 "subtask 1"、"subtask 2" 等。
- **子任务(Subtask) **:
- 由任务智能体进一步处理,结果反馈给任务智能体,再由其反馈给协调器。
- **对话智能体(Dialogue Agent) **:
- 处理人机交互任务,连接用户和机器人,起到沟通和协调作用。
- **外部资源(Browser、Document、Code 等) **:
- 对话智能体可访问多种外部资源,为对话和任务执行提供支持。
各 Agent 的分工
- **协调器 Agent(Coordinator) **:
- 负责系统的任务调度和流程控制。
- 决定任务分配给哪个任务智能体,并协调各智能体工作,确保任务有序进行。
- 接收任务智能体和对话智能体的反馈信息,根据信息调整任务分配和流程。
- **任务规划员(Task Agent) **:
- 接收协调器分配的任务,并将其分解为多个可执行子任务。
- 管理和监控子任务执行情况,收集子任务结果。
- 将子任务结果反馈给协调器,以便协调器做出进一步决策。
- **执行者(Dialogue Agent) **:
- 处理用户与系统之间的交互,包括接收用户输入、理解用户意图。
- 根据用户需求和系统状态,生成合适回应。
- 可访问外部资源(如浏览器、文档、代码等)获取更多信息。
未来发展方向
-
增强多模态支持:进一步集成更多的多模态 AI 模型,提升系统在图像、视频等非文本数据处理上的能力。
-
优化用户体验:通过改进 UI 设计和交互流程,使用户能够更直观地与系统进行交互。
-
扩展工具链集成:增加对更多第三方工具和服务的支持,提升系统的灵活性和适应性。
-
提升系统性能:通过优化代码和架构设计,提升系统的响应速度和处理能力。
随着 Manus 为首的通用 AI 应用的出现及 DeepSeek 低价高效策略的推行,相信会有更多人认识到 AI 不再昂贵,AI 的深度应用将不断涌现。虽然 TypeScript 目前并非主流 AI 应用开发语言,但作为与用户长期深度交流的语言,当 AI 应用真正融入用户屏幕时,它或许会继续发挥重要作用。
总结
LuguManus 通过整合多种技术和工具,展示了 AI 在桌面应用中的潜力。通过协调器、任务智能体和对话智能体的协作,系统能够高效地分解和执行复杂任务。随着 AI 技术的不断发展,LuguManus 为未来的 AI 应用提供了一个创新的范例。