获得徽章 0
- 赞过22
- 写了个自用的小工具,还原 macOS 老版启动台
先采集了支持调起的常见App,后续再逐渐补充其他App
部分app不支持调起暂时没有支持,后续会逐步更新支持的appmaclaunchpad.aizeten.me
赞过评论1 - 赞过评论1
- 想知道自己每天用 Cursor 问了多少次、AI 想了多少字?
github.com
我拿 Hooks 把对话和 thinking 都采下来,做了个本地看板,顺便把长 thinking 当英语阅读材料刷。赞过评论1 - 发现下载夹文件没归类、文件名全是乱码,整理好麻烦?
www.downloadpilot.top
于是春节撸了一个插件 Download Pilot,一次解决文件归类和命名问题
• 自动文件分类:自动按照图片、视频、文档归类文件夹
• 基于网页的智能命名: 利用页面标题、描述和域名等信息,把 a1b2c3d4.jpg 变成可读文件名
欢迎大家试用呀展开赞过72
【调研记录】绘本对话类音频怎么生成好呢
记录最近生成绘本项目做的一些调研(图片 + 对话音频 + 字幕)
1. 图片:
目前只搞单张图片AI生成还比较好解决,多张图片保证画风人物一致性 等到时候再去解决
2. 对话音频: 当前使用了 minimax的TTS服务 也调研了11lab的音频服务。
目标:文字能够按照角色生成对应音色的音频 + 字幕(比如女儿和父亲对话,需要生成时分别使用小女孩 + 成年男性的音色轮流生成, 如果再优化还需要考虑旁白音色)
Minimax:优势:支持返回字幕 subtitle_enable
❌ 劣势:目前API只支持单个音色,多个音色目前只能笨办法,拼接音频 和 字幕
11lab目前有对话 API, 一个接口搞定对话音频生成
❌ 劣势:不支持返回字幕
最终还是继续使用minimax,让用户录入时手动去选择音色, 后续可以考虑使用一些AI识别的手段提升效率。
展开评论点赞