LobsterAI — 全场景个人助理 Agent
7×24 小时帮你干活的全场景个人助理,由网易有道开发
English · 中文
LobsterAI 是由网易有道开发的全场景个人助理 Agent。它 7×24 小时待命,能够帮你完成日常办公中的各类事务 —— 数据分析、制作 PPT、生成视频、撰写文档、搜索信息、收发邮件、定时任务,以及更多。
LobsterAI 的核心是 Cowork 模式,它能在本地或沙箱环境中执行工具、操作文件、运行命令,一切都在你的监督下自主完成。此外,LobsterAI 支持通过钉钉、飞书、Telegram、Discord 等 IM 平台远程触发,让你在手机上也能随时指挥 Agent 工作。
核心特性
- 全场景办公助理 — 数据分析、PPT 制作、视频生成、文档撰写、Web 搜索、邮件收发,覆盖日常办公全流程
- 本地 + 沙箱执行 — 任务执行支持本地直接运行或隔离的 Alpine Linux 沙箱
- 内置技能 — 包括 Office 文档生成、Web 搜索、Playwright 自动化、Remotion 视频生成等
- 定时任务 — 支持对话式发起或 GUI 界面添加定时任务,如每日新闻收集、邮箱整理、周期性报告生成等
- 持久记忆 — 自动从对话中提取用户偏好与个人信息,跨会话记住你的习惯,越用越懂你
- IM 远程操控 — 通过钉钉、飞书、Telegram、Discord 在手机端随时触发 Agent
- 权限门控 — 所有敏感工具调用需用户明确批准后执行
- 跨平台 — macOS(Intel + Apple Silicon)、Windows、Linux 桌面端,配合 IM 实现移动端覆盖
- 数据本地化 — SQLite 本地存储,聊天记录和配置不离开你的设备
工作原理
快速开始
环境要求
- Node.js >= 24 < 25
- npm
安装与开发
# 克隆仓库
git clone https://github.com/netease-youdao/LobsterAI.git
cd lobsterai
# 安装依赖
npm install
# 启动开发环境(Vite 开发服务器 + Electron 热重载)
npm run electron:dev
开发服务器默认运行在 http://localhost:5175。
生产构建
# 编译 TypeScript + Vite 打包
npm run build
# ESLint 代码检查
npm run lint
打包分发
使用 electron-builder 生成各平台安装包,输出到 release/ 目录。
# macOS (.dmg)
npm run dist:mac
# macOS - 仅 Intel
npm run dist:mac:x64
# macOS - 仅 Apple Silicon
npm run dist:mac:arm64
# macOS - Universal (双架构)
npm run dist:mac:universal
# Windows (.exe NSIS 安装包)
npm run dist:win
# Linux (.AppImage)
npm run dist:linux
架构概览
LobsterAI 采用 Electron 严格进程隔离架构,所有跨进程通信通过 IPC 完成。
进程模型
Main Process(src/main/main.ts):
- 窗口生命周期管理
- SQLite 数据持久化
- CoworkRunner — Claude Agent SDK 执行引擎
- IM 网关 — 钉钉、飞书、Telegram、Discord 远程接入
- 40+ IPC 通道处理
- 安全:context isolation 启用,node integration 禁用,sandbox 启用
Preload Script(src/main/preload.ts):
- 通过
contextBridge暴露window.electronAPI - 包含
cowork命名空间用于会话管理和流式事件
Renderer Process(src/renderer/):
- React 18 + Redux Toolkit + Tailwind CSS
- 所有 UI 和业务逻辑
- 仅通过 IPC 与主进程通信
目录结构
src/
├── main/ # Electron 主进程
│ ├── main.ts # 入口,IPC 处理
│ ├── preload.ts # 安全桥接
│ ├── sqliteStore.ts # SQLite 存储
│ ├── coworkStore.ts # 会话/消息 CRUD
│ ├── skillManager.ts # 技能管理
│ ├── im/ # IM 网关(钉钉/飞书/Telegram/Discord)
│ └── libs/
│ ├── coworkRunner.ts # Agent SDK 执行器
│ ├── coworkVmRunner.ts # 沙箱 VM 执行
│ ├── coworkSandboxRuntime.ts # 沙箱生命周期
│ └── coworkMemoryExtractor.ts # 记忆提取
│
├── renderer/ # React 前端
│ ├── App.tsx # 根组件
│ ├── types/ # TypeScript 类型定义
│ ├── store/slices/ # Redux 状态切片
│ ├── services/ # 业务逻辑层(API/IPC/i18n)
│ └── components/
│ ├── cowork/ # Cowork UI 组件
│ ├── artifacts/ # Artifact 渲染器
│ ├── skills/ # 技能管理 UI
│ ├── im/ # IM 集成 UI
│ └── Settings.tsx # 设置面板
│
SKILLs/ # 技能定义目录
├── skills.config.json # 技能启停与排序配置
├── web-search/ # Web 搜索
├── docx/ # Word 文档生成
├── xlsx/ # Excel 表格
├── pptx/ # PowerPoint 演示
├── pdf/ # PDF 处理
├── remotion/ # 视频生成
├── playwright/ # Web 自动化
└── ... # 更多技能
Cowork 系统
Cowork 是 LobsterAI 的核心功能 —— 基于 Claude Agent SDK 的 AI 工作会话系统。它面向办公场景设计,能够自主完成数据分析、文档生成、信息检索等复杂任务。
执行模式
| 模式 | 说明 |
|---|---|
auto | 自动根据上下文选择执行方式 |
local | 本地直接执行,全速运行 |
sandbox | 隔离的 Alpine Linux VM,安全优先 |
流式事件
Cowork 通过 IPC 事件实现实时双向通信:
message— 新消息加入会话messageUpdate— 流式内容增量更新permissionRequest— 工具执行需要用户审批complete— 会话执行完毕error— 执行出错
权限控制
所有涉及文件系统、终端命令、网络请求的工具调用都需要用户在 CoworkPermissionModal 中明确批准。支持单次批准和会话级批准。
技能系统
LobsterAI 内置 16 种技能,覆盖办公、创作、自动化等多种场景,通过 SKILLs/skills.config.json 配置启停和排序:
| 技能 | 功能 | 典型场景 |
|---|---|---|
| web-search | Web 搜索 | 信息检索、资料收集 |
| docx | Word 文档生成 | 报告撰写、方案输出 |
| xlsx | Excel 表格生成 | 数据分析、报表制作 |
| pptx | PowerPoint 制作 | 演示文稿、汇报材料 |
| PDF 处理 | 文档解析、格式转换 | |
| remotion | 视频生成(Remotion) | 宣传视频、数据可视化动画 |
| playwright | Web 自动化 | 网页操作、自动化测试 |
| canvas-design | Canvas 绘图设计 | 海报、图表设计 |
| frontend-design | 前端 UI 设计 | 原型制作、页面设计 |
| develop-web-game | Web 游戏开发 | 小游戏快速原型 |
| scheduled-task | 定时任务 | 周期性工作自动执行 |
| weather | 天气查询 | 天气信息获取 |
| local-tools | 本地系统工具 | 文件管理、系统操作 |
| create-plan | 计划编排 | 项目规划、任务分解 |
| skill-creator | 自定义技能创建 | 扩展新能力 |
| imap-smtp-email | 邮件收发 | 邮件处理、自动回复 |
支持通过 skill-creator 创建自定义技能并热加载。
定时任务
LobsterAI 支持创建定时任务,让 Agent 按计划自动执行重复性工作。
创建方式
- 对话式创建 — 直接用自然语言告诉 Agent(如「每天早上 9 点帮我收集科技新闻」),Agent 会自动创建对应的定时任务
- GUI 界面创建 — 在定时任务管理面板中手动添加,可视化配置执行时间和任务内容
典型场景
| 场景 | 示例 |
|---|---|
| 新闻收集 | 每天早上自动收集行业资讯并生成摘要 |
| 邮箱整理 | 定时检查收件箱,分类整理并汇总重要邮件 |
| 数据报告 | 每周自动生成业务数据分析报告 |
| 信息监控 | 定期检查指定网站内容变化并通知 |
| 工作提醒 | 按计划生成待办事项清单或会议纪要 |
定时任务基于 Cron 表达式调度,支持分钟、小时、日、周、月等多种周期粒度。任务执行时会自动启动 Cowork 会话,结果可通过桌面端查看或经 IM 推送到手机。
IM 集成 — 手机端远程操控
LobsterAI 支持将 Agent 桥接到多种 IM 平台。在手机上通过 IM 发送消息即可远程触发桌面端的 Agent 执行任务,随时随地指挥你的个人助理。
| 平台 | 协议 | 说明 |
|---|---|---|
| 钉钉 | DingTalk Stream | 企业机器人双向通信 |
| 飞书 | Lark SDK | 飞书应用机器人 |
| Telegram | grammY | Bot API 接入 |
| Discord | discord.js | Discord Bot 接入 |
在设置面板中配置对应平台的 Token/密钥即可启用。配置完成后,你可以在手机 IM 中直接对 Agent 下达指令(如「帮我分析这份数据」「做一份本周工作汇报 PPT」),Agent 会在桌面端自动执行并返回结果。
持久记忆
LobsterAI 内置记忆系统,能够跨会话记住你的个人信息和偏好,让 Agent 越用越懂你。
记忆获取方式
- 自动提取 — 对话过程中,系统自动识别并记录你的个人信息(姓名、职业等)、偏好习惯(喜好的语言、格式、风格)和个人事实(养的宠物、使用的工具等),无需手动操作
- 主动告知 — 在对话中直接说「记住我喜欢用 Markdown 格式」「记下我的项目叫 LobsterAI」等,Agent 会以更高置信度存储
- 手动管理 — 在设置面板的记忆管理界面中手动添加、编辑或删除记忆条目
工作机制
每轮对话结束后,记忆提取器会分析对话内容:
| 提取类型 | 示例 | 置信度 |
|---|---|---|
| 个人档案 | 「我叫张三」「我是产品经理」 | 高 |
| 个人所有 | 「我养了一只猫」「我有一台 MacBook」 | 高 |
| 个人偏好 | 「我喜欢简洁的风格」「我偏好英文回复」 | 中高 |
| 助手偏好 | 「回复时不要用 emoji」「代码用 TypeScript」 | 中高 |
| 主动告知 | 「记住这个」「请记下来」 | 最高 |
提取的记忆会自动去重、合并,并在后续会话中注入到 Agent 的上下文中,使 Agent 的回复更加个性化和贴合你的需求。
记忆设置
| 配置项 | 说明 | 默认值 |
|---|---|---|
| 记忆开关 | 启用或关闭记忆功能 | 开启 |
| 自动捕获 | 是否自动从对话中提取记忆 | 开启 |
| 捕获严格度 | 严格 / 标准 / 宽松,控制自动提取的灵敏度 | 标准 |
| 最大注入条数 | 每次会话注入的记忆上限(1-60) | 12 |
数据存储
所有数据存储在本地 SQLite 数据库(lobsterai.sqlite,位于用户数据目录)。
| 表 | 用途 |
|---|---|
kv | 应用配置键值对 |
cowork_config | Cowork 设置(工作目录、系统提示词、执行模式) |
cowork_sessions | 会话元数据 |
cowork_messages | 消息历史 |
scheduled_tasks | 定时任务定义 |
安全模型
LobsterAI 在多个层面实施安全控制:
- 进程隔离 — context isolation 启用,node integration 禁用
- 权限门控 — 敏感工具调用需用户明确审批
- 沙箱执行 — 可选 Alpine Linux VM 隔离执行环境
- 工作区边界 — 文件操作限制在指定工作目录内
- IPC 验证 — 所有跨进程调用经过类型检查
技术栈
| 层 | 技术 |
|---|---|
| 框架 | Electron 40 |
| 前端 | React 18 + TypeScript |
| 构建 | Vite 5 |
| 样式 | Tailwind CSS 3 |
| 状态 | Redux Toolkit |
| AI 引擎 | Claude Agent SDK (Anthropic) |
| 存储 | sql.js |
| Markdown | react-markdown + remark-gfm + rehype-katex |
| 图表 | Mermaid |
| 安全 | DOMPurify |
| IM | dingtalk-stream · @larksuiteoapi/node-sdk · grammY · discord.js |
配置
应用配置
应用级配置存储在 SQLite kv 表中,通过设置面板修改。
Cowork 配置
Cowork 会话配置包含:
- 工作目录 — Agent 操作的根目录
- 系统提示词 — 自定义 Agent 行为
- 执行模式 —
auto/local/sandbox
国际化
支持中文(默认)和英文两种语言,通过设置面板切换。
开发规范
-
TypeScript 严格模式,函数式组件 + Hooks
-
2 空格缩进,单引号,分号
-
组件
PascalCase,函数/变量camelCase,Redux 切片*Slice.ts -
Tailwind CSS 优先,避免自定义 CSS
-
提交信息遵循
type: short imperative summary格式(如feat: add artifact toolbar)
大多数人用 AI,是在消耗时间。
少数人用 AI,是在积累资产。
其实我还有其他进阶的想法,就是动态的一直压缩记忆,
按时间,还是按事件分类的角度去分类,我还没想清。
如果有好的建议,希望可以留言评论,谢谢🙏
▶︎ 如果这篇文章有帮助到你
可以点击下方关注我~
可以对文章点赞让我知道 👍
你们的关注与点赞是我继续写作的动力 🙏🏼
▶︎ 如果你对目前的职涯感到迷茫,或者对AI编程,以及工厂软件相关的有疑问都可以私信我,我都会尽可能给与你们解答和帮助 💡
我是 fishyue,深耕一线制造业近10年的工业软件架构师与 AI 实践者,长期从事 MOM、WMS、MES 等企业级系统建设,擅长将前沿 AI 编程与工业场景深度融合,探索 AI Agent 驱动的新一代智能工厂架构与开发范式
🔗 Connect With Me | 联系我
微信公众号:数字之心AI-Evangelist