不是调 API 的聊天机器人,是给大模型装上眼睛和手。
即将开源一个项目(代码本周更新在GitHub):Sightflow → sightflow.dev
它能做什么?
让 AI 自己打开微信、企业微信、WhatsApp,像人一样:
- 看界面、读消息
- 思考(接任意大模型)
- 用键盘打字回复
核心机制
- 视觉自动化状态机:窗口识别、任务切换、状态流转
- Electron:跨平台(macOS / Windows)
- 本地 Skill Server:你只需写业务逻辑(客诉、销售、自动回复),底层视觉执行已封装好
为什么不是 API 套壳?
因为微信/企微/WhatsApp 根本没有给开发者开放可用的 API。传统 RPA 脆弱且难以结合 AI。Sightflow 直接把 AI 从聊天框里拽出来,操作真实界面。
适用场景
- 私域客服/销售自动化(无 API 场景)
- 跨多个私域渠道的统一消息处理
- 任何需要“AI 模拟人操作桌面软件”的自动化流程
项目现状
- 代码已开源(GitHub 在官网首页)
- 视觉执行层基本稳定,可跑 demo
- 急需更多开发者共建 Skill 库、优化状态机、适配更多应用
如果你也被“无 API”卡过脖子,或者想用 AI 做点能赚钱的东西,欢迎到时 clone 下来跑一跑。 欢迎交流。