LuguManus: 一个纯 Typescript 开发的类 Manus

233 阅读4分钟

LuguManus 应用介绍

LuguManus 是一款由 TypeScript 和 Electron 构建的多智能体协作桌面应用。其核心在于利用 AI 大模型协调网络搜索、浏览器自动化操作及本地文件处理等技术,以完成复杂任务。

项目开源地址

architecture.png

在 AI 浪潮与开源盛行的背景下,LuguManus 仅用 5 天便利用 TypeScript 和 Electron 完成了类 Manus 的雏形。将通用 AI 从 Python 等服务器语言转换为 Electron + TypeScript 这类前端技术,不仅降低了处理网页墙的难度,还为 AI 成为电脑控制器提供了更多可能,使其不再局限于浏览器的沙盒环境。

LuguManus 的主要技术支持

  • Qwen:由阿里提供的多模态大模型,支持文本、编码、图片识别等多种能力。

  • Camel:专注于智能体规模扩展的研究框架。

  • Browser-extension:用于执行浏览器自动化的 Chrome 插件。

LuguManus 具备多代理协作、智能任务分解、工具链集成、响应式数据流、浏览器模拟交互和多模型支持等特性。通过三层代理架构协同解决问题、拆解任务,集成多种工具组件,基于 RxJS 实现流畅的异步消息处理,模拟浏览器行为,支持多种 AI 模型。

整体流程概述

  1. **协调器(Coordinator) **:

    - 系统的核心控制单元,负责管理和协调各智能体的工作,决定任务的分配和流程。

  1. **任务智能体(Task Agent) **:

    - 负责具体任务执行,将任务分解成多个子任务,如 "subtask 1"、"subtask 2" 等。

  1. **子任务(Subtask) **:

    - 由任务智能体进一步处理,结果反馈给任务智能体,再由其反馈给协调器。

  1. **对话智能体(Dialogue Agent) **:

    - 处理人机交互任务,连接用户和机器人,起到沟通和协调作用。

  1. **外部资源(Browser、Document、Code 等) **:

    - 对话智能体可访问多种外部资源,为对话和任务执行提供支持。

各 Agent 的分工

  1. **协调器 Agent(Coordinator) **:

    - 负责系统的任务调度和流程控制。

    - 决定任务分配给哪个任务智能体,并协调各智能体工作,确保任务有序进行。

    - 接收任务智能体和对话智能体的反馈信息,根据信息调整任务分配和流程。

  1. **任务规划员(Task Agent) **:

    - 接收协调器分配的任务,并将其分解为多个可执行子任务。

    - 管理和监控子任务执行情况,收集子任务结果。

    - 将子任务结果反馈给协调器,以便协调器做出进一步决策。

  1. **执行者(Dialogue Agent) **:

    - 处理用户与系统之间的交互,包括接收用户输入、理解用户意图。

    - 根据用户需求和系统状态,生成合适回应。

    - 可访问外部资源(如浏览器、文档、代码等)获取更多信息。

未来发展方向

  • 增强多模态支持:进一步集成更多的多模态 AI 模型,提升系统在图像、视频等非文本数据处理上的能力。

  • 优化用户体验:通过改进 UI 设计和交互流程,使用户能够更直观地与系统进行交互。

  • 扩展工具链集成:增加对更多第三方工具和服务的支持,提升系统的灵活性和适应性。

  • 提升系统性能:通过优化代码和架构设计,提升系统的响应速度和处理能力。

随着 Manus 为首的通用 AI 应用的出现及 DeepSeek 低价高效策略的推行,相信会有更多人认识到 AI 不再昂贵,AI 的深度应用将不断涌现。虽然 TypeScript 目前并非主流 AI 应用开发语言,但作为与用户长期深度交流的语言,当 AI 应用真正融入用户屏幕时,它或许会继续发挥重要作用。

总结

LuguManus 通过整合多种技术和工具,展示了 AI 在桌面应用中的潜力。通过协调器、任务智能体和对话智能体的协作,系统能够高效地分解和执行复杂任务。随着 AI 技术的不断发展,LuguManus 为未来的 AI 应用提供了一个创新的范例。