让 AI Agent 自动生成图片和视频:开源 Ultimate AI Media Generator Skill

2 阅读1分钟

背景

现在 AI 编程工具越来越强大,Codex、Claude Code、Cursor 等工具让开发者效率倍增。但它们有一个明显的短板:无法直接生成图片和视频。

想象一下,你在用 Claude Code 写一个网站,需要一张 banner 图,还得切换到其他工具去生成。或者在写博客时,需要为文章配图,也要手动操作。

Ultimate AI Media Generator Skill 就是为了解决这个问题而生的。

它是什么?

一个开源的技能包,让 AI Agent 能够直接调用顶级图片/视频生成模型:

  • 图片模型:Nano Banana 2、Nano Banana Pro
  • 视频模型:Sora 2、Seedance、Kling 2.6、Veo 3.1

支持哪些平台?

  • OpenClaw
  • Claude Code
  • Codex
  • Cursor
  • Antigravity
  • 其他支持 skill 的 AI 编程平台

如何使用?

安装

npx skills add ZeroLu/Ultimate-AI-Media-Generator-Skill --all

配置 API Key

安装完成后,按照 README 中的说明配置你的 API Key。

开始使用

直接对 AI 说:

帮我生成一张可爱的小猫图片,3D 卡通风格,16:9 比例

AI 就会自动调用模型生成图片并返回给你。

实际应用场景

  1. UI 设计图生成:写前端代码时,让 AI 自动生成设计稿
  2. 博客配图:写文章时自动生成配图
  3. 营销素材:批量生成产品宣传图
  4. 视频创作:生成短视频素材

技术架构

  • 统一调用多个顶级图片/视频生成模型
  • Python CLI 工具,支持命令行和程序化调用
  • 完善的错误处理和积分保护机制

开源地址

GitHub: github.com/ZeroLu/Ulti…

MIT 协议,欢迎 Star 和贡献!