一天一个开源项目(第25篇):Clawra - 为 OpenClaw 赋予「自拍」能力的 Skill

0 阅读8分钟

引言

"让 AI 助手不仅能聊,还能按一句「发张自拍」生成并发送一张符合人设的图片。"

这是"一天一个开源项目"系列的第25篇文章。今天带你了解的项目是 ClawraGitHub),由 SumeLabs 开源。来剖析下号称电子女友的开项目项目,到底有哪些功能。

OpenClaw 通过 Telegram、Discord、WhatsApp 等渠道与你对话,但默认能力以文本为主。若希望助手具备「形象」、能响应「发张自拍」「你现在在干嘛?发张图」这类请求,就需要图像生成 + 与渠道发图的能力。Clawra 是一个 OpenClaw Skill:基于 fal.ai 调用 xAI Grok Imagine,用一张固定参考图(reference image)保持形象一致,按用户描述生成「自拍」并通过 OpenClaw Gateway 在对应平台发送。一条 npx clawra@latest 即可完成检查、获取 fal.ai Key、安装 Skill、配置与 SOUL.md 注入,让助手支持 Mirror(全身/穿搭)与 Direct(近景/场景)两种自拍模式。

你将学到什么

  • Clawra 的定位:为 OpenClaw 增加「一致形象 + 按需生成自拍并发图」的 Skill
  • 快速开始:npx clawra@latest 与手动安装、配置 openclaw.json 与 SOUL.md
  • 自拍模式(Mirror / Direct)与参考图机制
  • 技术栈:fal.ai、Grok Imagine、OpenClaw Gateway、多平台发图
  • 与纯文本助手及其他图像生成方案的对比

前置知识

  • 已安装并配置 OpenClaw(或通过 OpenClawInstaller 部署)
  • 了解 OpenClaw 的 Skill 机制(技能安装在 ~/.openclaw/skills/、通过 openclaw.json 启用)
  • fal.ai 账号并创建 API Key(有免费额度)

项目背景

项目简介

Clawra 是面向 OpenClawSkill(技能),为 AI 助手增加基于固定参考形象的自拍生成与多渠道发图能力。用户可以说「发张自拍」「发一张戴牛仔帽的」「你现在在咖啡馆,发张图」等,助手会通过本 Skill 调用 fal.ai 的 xAI Grok Imagine 生成与参考图一致的图像,并经由 OpenClaw Gateway 在 Telegram、Discord、WhatsApp、Slack、Signal、MS Teams 等渠道以图片形式回复。Skill 提供 Mirror(全身、穿搭)与 Direct(近景、场景)两种模式,便于适配不同提示词;参考图托管在 CDN,保证生成形象一致。

项目解决的核心问题

  • OpenClaw 默认以文本为主,无法响应「发图」「自拍」类需求
  • 需要与助手「人设」一致的图像生成,而不是随机风格
  • 希望生成结果能直接发到当前对话渠道,而非另开工具

面向的用户群体

  • 已使用 OpenClaw、希望给助手增加「有形象、能发图」能力的用户
  • 想学习 OpenClaw Skill 开发与 fal.ai 图像 API 集成的开发者
  • 需要「固定人设 + 多场景自拍」的创意或陪伴类应用场景

作者/团队介绍

  • 组织SumeLabsGitHub
  • 官网clawra.dev
  • 项目创建时间:2026 年 2 月(GitHub 显示 created_at 2026-02-08)

项目数据

  • GitHub Stars: 1.4k+
  • 🍴 Forks: 259+
  • 📦 版本: 以 main 为主干,通过 npx clawra@latest 使用最新安装逻辑
  • 📄 License: MIT(README 注明)
  • 🌐 官网: clawra.dev
  • 💬 社区: GitHub Issues

主要功能

核心作用

25-01-crawra.png

Clawra 的核心作用是在 OpenClaw 上增加「自拍」能力

  1. 一致形象生成:使用 CDN 上的固定参考图,通过 fal.ai(Grok Imagine)生成与「人设」一致的自拍图
  2. 多渠道发图:生成的图片通过 OpenClaw Gateway 发送到当前会话所在平台(Discord、Telegram、WhatsApp、Slack、Signal、MS Teams)
  3. 两种模式:Mirror(全身、穿搭类)与 Direct(近景、场景类),对应不同提示词风格
  4. 人设注入:安装时可向 SOUL.md 注入「你有实体形象、可以自拍」的说明,使助手在对话中主动使用该 Skill

使用场景

  1. 陪伴/人设类助手

    • 用户说「发张自拍」「发一张在沙滩的」,助手生成并回复一张符合设定形象的图
  2. 穿搭/造型展示

    • 利用 Mirror 模式生成全身或穿搭类图片,用于虚拟形象展示
  3. 场景化回复

    • 「你现在在咖啡馆」→ 生成咖啡馆场景近景图并发送,增强情境感
  4. 多平台统一体验

    • 同一套 OpenClaw + Clawra,在 Telegram、Discord、WhatsApp 等任意已配置渠道都能「发图」
  5. 学习 Skill 与图像 API

    • 参考项目结构(SKILL.md、scripts、openclaw.json 配置、SOUL 注入)与 fal.ai 调用方式,做二次开发或类似 Skill

快速开始

前置:已安装并配置 OpenClaw;拥有 fal.ai 账号并可在 fal.ai/dashboard/k… 创建 API Key(有免费档)。

一键安装(推荐)

npx clawra@latest

脚本会:检查 OpenClaw 是否已安装、引导获取 fal.ai API Key、将 Skill 安装到 ~/.openclaw/skills/clawra-selfie/、在 openclaw.json 中启用并写入 FAL_KEY、向 SOUL.md 注入自拍能力说明。

手动安装

# 1. 在 fal.ai 创建 API Key

# 2. 克隆 Skill
git clone https://github.com/SumeLabs/clawra ~/.openclaw/skills/clawra-selfie

# 3. 在 ~/.openclaw/openclaw.json 的 skills.entries 中添加:
# "clawra-selfie": { "enabled": true, "env": { "FAL_KEY": "你的_fal_key" } }

# 4. 在 ~/.openclaw/workspace/SOUL.md 中增加自拍能力说明(见 README 模板)

安装并重启 Gateway 后,在任意已配置渠道对助手说「发张自拍」「发一张戴牛仔帽的」「你现在在咖啡馆,发张图」等即可触发生成与发图。

核心特性

  1. 固定参考图

    • 参考图托管在 jsDelivr CDN,保证每次生成形象一致
  2. Mirror / Direct 双模式

    • Mirror:适合全身、穿搭、fashion 类提示(如 wearing, outfit)
    • Direct:适合近景、场景、肖像(如 cafe, beach, portrait, smile)
  3. fal.ai + Grok Imagine

    • 图像生成走 fal.ai,模型为 xAI Grok Imagine;无需自建 GPU,按调用计费(fal 有免费额度)
  4. OpenClaw 原生集成

    • 以标准 Skill 形式安装,通过 Gateway API 发图,与现有渠道、记忆、人设一致
  5. SOUL.md 人设注入

    • 安装时可选向 SOUL.md 写入「你有实体形象、可以自拍,在用户要图时使用 clawra-selfie」,减少重复说明

项目优势

对比项Clawra + OpenClaw纯文本 OpenClaw独立图像 Bot + 聊天 Bot
发图能力按人设生成并直接发到当前会话需两套 Bot 或手动转发
形象一致性固定参考图 + Grok Imagine-视实现而定
部署与配置一条 npx + fal Key同 OpenClaw多套配置
渠道覆盖复用 OpenClaw 已配置渠道同左需逐渠道对接

为什么选择 Clawra?

  • 即插即用:已有 OpenClaw 时,一条命令即可增加自拍与发图能力
  • 人设统一:参考图 + 模式设计,便于维持「同一个形象」的体验
  • 开源可改:Skill 结构清晰,可基于此做自己的形象、提示词或接入其他图像 API

项目详细剖析

项目结构

clawra/
├── bin/
│   └── cli.js          # npx 安装器入口
├── skill/
│   ├── SKILL.md        # Skill 定义(能力描述、触发方式等)
│   ├── scripts/        # 生成与调用逻辑
│   └── assets/         # 参考图等资源
├── templates/
│   └── soul-injection.md   # 注入 SOUL.md 的模板
└── package.json
  • bin/cli.jsnpx clawra@latest 执行时运行,负责环境检查、引导 fal Key、克隆/安装 skill、写 openclaw.json、注入 SOUL
  • skill/:真正被 OpenClaw 加载的 Skill 内容;SKILL.md 定义能力与触发,scripts 完成 fal 调用与 Gateway 发图
  • templates/soul-injection.md:安装时追加到用户 SOUL.md 的文案,说明「可自拍、使用 clawra-selfie」

技术链路简述

  1. 用户请求:在 Telegram/Discord 等渠道说「发张自拍」「发一张在咖啡店的」
  2. OpenClaw:将消息交给配置的 LLM,LLM 根据 SOUL.md 与 SKILL 描述决定调用 clawra-selfie
  3. Clawra Skill:根据用户语句与模式(Mirror/Direct)构造提示词,携带参考图 URL 调用 fal.ai(Grok Imagine),得到图片
  4. 发图:通过 OpenClaw Gateway API 将图片发回当前会话所在渠道

配置要点

  • 环境变量:Skill 所需 FAL_KEY 在 openclaw.json 的 skills.entries["clawra-selfie"].env 中配置,由安装脚本或手动填写
  • 参考图:默认使用仓库内 assets/clawra.png 的 CDN 地址;若 fork 后想用自己的形象,可替换该资源并更新引用
  • SOUL.md:不注入也可通过对话说明「请用 clawra-selfie 发图」,但注入后助手更易自动使用

注意事项

  • 依赖 OpenClaw:必须先安装并运行 OpenClaw,且至少配置一个消息渠道与 LLM
  • fal.ai 计费:图像生成按 fal 计费,免费额度用完后需付费;注意 Key 不要泄露
  • 内容与合规:生成内容受 fal.ai 与 xAI 政策约束,请勿用于违规用途

项目地址与资源

官方资源

相关资源

适用人群

  • 已用 OpenClaw 并想加「发图」能力的用户:一条 npx 即可体验自拍与多渠道发图
  • 做陪伴/人设类产品的开发者:可参考参考图 + 双模式 + SOUL 注入的设计
  • 学习 OpenClaw Skill 开发的人:项目结构简单,适合作为第二个 Skill 或自建类似能力的模板

欢迎来我中的个人主页找到更多有用的知识和有趣的产品