开源一个视觉自动化框架:Sightflow,让 AI 像人一样操作微信/WhatsApp(不是 API 套壳)

0 阅读1分钟

不是调 API 的聊天机器人,是给大模型装上眼睛和手。

即将开源一个项目(代码本周更新在GitHub):Sightflowsightflow.dev

它能做什么?

让 AI 自己打开微信、企业微信、WhatsApp,像人一样:

  • 看界面、读消息
  • 思考(接任意大模型)
  • 用键盘打字回复

核心机制

  • 视觉自动化状态机:窗口识别、任务切换、状态流转
  • Electron:跨平台(macOS / Windows)
  • 本地 Skill Server:你只需写业务逻辑(客诉、销售、自动回复),底层视觉执行已封装好

为什么不是 API 套壳?

因为微信/企微/WhatsApp 根本没有给开发者开放可用的 API。传统 RPA 脆弱且难以结合 AI。Sightflow 直接把 AI 从聊天框里拽出来,操作真实界面。

适用场景

  • 私域客服/销售自动化(无 API 场景)
  • 跨多个私域渠道的统一消息处理
  • 任何需要“AI 模拟人操作桌面软件”的自动化流程

项目现状

  • 代码已开源(GitHub 在官网首页)
  • 视觉执行层基本稳定,可跑 demo
  • 急需更多开发者共建 Skill 库、优化状态机、适配更多应用

官网:sightflow.dev

如果你也被“无 API”卡过脖子,或者想用 AI 做点能赚钱的东西,欢迎到时 clone 下来跑一跑。 欢迎交流。