Agent 实战: 智语 + baoyu-skills 自动发布文章到公众号

0 阅读5分钟

大家好,我是双越。wangEditor 作者,前百度 滴滴 资深前端工程师,慕课网精英讲师,PMP,前端面试派 作者。

我正在开发一个 AI Agent 项目 智语 一个 AI Agent 个人助手,类似于 Openclaw 小龙虾。
包括 tools skills memory context permission subagent session command hook MCP-server ...
你可以免费围观项目过程,也可以加入项目学习和开发,有兴趣的私信我~

本文记录了我使用 智语 + baoyu-skills ,来实现 AI 写图文博客并发布到微信公众号的整个过程。给各位 AI Agent 学习和使用者作为参考。

安装和初始化

参考智语的官网和文档 zhitalk.chat/ ,使用 NPM 全局安装 zhitalk

npm i zhitalk -g

然后在控制台执行 zhitalk 命令,第一次执行会有一个初始化过程

  • 创建数据库
  • 安装必要的 skills:find-skills 和 skill-creator
  • 创建配置文件 zhitalk.json

image.png

然后根据它的提示,你打开 zhitalk.json 配置文件,写入必要配置,参考文档 zhitalk.chat/#config
例如我用的是 kimi 大模型,我的配置文件如下。其他模型可参考文档 zhitalk.chat/#models

image.png

修改完配置文件以后,再重新执行 zhitalk 就可以正常运行了。此时你可以和它随意对话。

image.png

安装 baoyu-skills

baoyu-skills 是一个写作技能集合,用于 AI Agent ,如 Claude Code、Codex、Openclaw 等,当然也适用于【智语】项目。通过 baoyu-skills 我们可以使用 AI 写作、AI 生成图片、自动发布到微信公众号。

在控制台执行如下命令,安装 baoyu-skills

npx skills add jimliu/baoyu-skills

安装过程中会让你选择安装哪些 skills ,直接全部选择即可,多了也没关系。
然后,选择 Openclaw 的安装方式,因为【智语】的 skills 目录是参考 Openclaw 的。
很快就安装完成了,如下图。PS. 如果失败,很有可能是那你本地网络原因,访问不了 GitHub 。

image.png

因为 选择 Openclaw 的安装方式,skills 将会被安装到 ~/.agents/skills 目录下

image.png

执行 zhitalk 命令,问它有多少 skills ,它能有所有 baoyu-skills ,说明加载成功了。

image.png

生成微信 API key

你要先注册自己的微信公众号,然后打开 微信开发者平台 登录。
在这里可以看到你的 AppID 和 AppSecret ,要注意保密,不要提交到 GitHub 。
然后把你电脑 IP (可以在这里查 ip.xxir.com/ )加入到 API IP 白名单。

image.png

在你电脑新建一个文件 ~/.baoyu-skills/.env 写入你的 AppID 和 AppSecret

WECHAT_APP_ID=xxx
WECHAT_APP_SECRET=xxx

发布到微信公众号

第一次测试,越简单越好,排除一些不必要的干扰因素和步骤,只测试核心功能。
准备一个文本文件 shui-diao-ge-tou.md ,内容是苏轼的《水调歌头 明月几时有》 。随便下载一个图片 sushi.jpg ,存储在电脑桌面上。这就是原始材料。

运行 zhitalk 输入如下内容

我要发布一篇文章到微信公众号,内容在桌面的 shui-diao-ge-tou.md ,封面在桌面 sushi.jpg

zhitalk 很快发布完成,它的过程如下

  • 读取 shui-diao-ge-tou.md 文本文件
  • 加载 skill baoyu-post-to-wechat 这是最关键的一步
  • 读取 skill 相关文档,详细流程
  • 运行 bun xxx 脚本,发布到公众号

image.png

打开微信公众号,可以看到有草稿了。发布成功,核心流程跑通了,完美的第一步!

image.png

AI 生成图片

以上测试的内容、图片都是本地的,真正 AI 写作,内容都是 AI 生成的。AI 生成文字没问题,但 AI 生成图片怎么办呢?

baoyu-skills 支持很多种 AI 生成图片的方式,多种大模型,其中阿里云的 DASHSCOPE 国内网络可用、且有免费试用额度,比较适合我们学习使用。
修改 .baoyu-skills/.env 增加 DASHSCOPE_API_KEY ,去阿里百炼平台生成 API key

DASHSCOPE_API_KEY=xxx 

执行 zhitalk 测试一下,输入的内容一定要有“公众号”关键字。

生成一张主题是 spacex starship 的封面图,我将用于发布微信公众号

zhitalk 进行了如下步骤:

  • 加载 skill baoyu-cover-image ,这一步最重要
  • 加载 skill 相关的文件,详细的步骤和说明
  • 写出生成图片的详细的 prompt ,并让我确认

image.png

待我确认完以后,zhitalk 加载 skill baoyu-image-gen 并调用大模型接口,生成图片

image.png

本地打开图片,还是比较符合预期的。AI 生成图片的流程跑通了,又是顺利的一步。

image.png

完整流程

上文中的核心内容都跑通了,现在尝试一个完整的例子,完全让 AI 生成内容,并发布到公众号。
执行 zhitalk 然后输入如下内容:

我想写一篇文章发布到微信公众号,主题是“AI Agent 未来将改变哪些行业”,2000字左右。找出 4-5 个行业,并要给出充分的理由。文章内插入2-3个相关图片,图文并茂,易读。你来生成封面图片。文章样式主题要现代化,不俗套。作者:双越

zhitalk 经过一系列操作,写文章,生成图片,发布文章,最终发布成功了。公众号草稿箱也有了。

image.png

但我发现了一个问题:打开文章以后,只有文字,没有图片。封面图是没问题的。
让 zhitalk 来检查一下,继续输入:

文章发布成功了,标题、封面、内容都有了。但是,文章内容只有文字,没有图片。你再来检查一下。

zhitalk 很快找到了问题,又重新修改了文章内容,这次把图片给内嵌进去了,如下图

image.png

重新发布以后,再检查文章,就有图片了。zhitalk 一次就解决了这个问题,非常高效。

image.png

最后

智语,是一个通用的 AI Agent 智能体。baoyu-skills 是一些通用的、规范的 skills。都是通用的、标准的,两者自然可以结合使用。
如果你也想从 0 开发一个 AI Agent 智能体,一个智语项目,可以私信我~