AI智能体|扣子(Coze)工作流搭建【播客制作】

190 阅读8分钟

播客制作就是这么简答!输入文章链接,用Coze工作流3分钟一键将文章变为播客!(附教程和源码!)

☀大家好,我是芝麻☀

AI智能体,AI副业搞米,AI实战案例分享

👇点击关注,每篇文章能给你带来一定的收获👇

图片

 

你好,我是芝麻!

比起刷手机时的‘信息轰炸’,播客像个藏在耳机里的‘秘密树洞’,不用盯着屏幕,不用急着点赞,光是听两个人漫无边际地聊天,或是一位主播慢慢讲完一个长故事,就能把一天的疲惫都揉碎在声音里?

最近发现个特别真实的场景——早高峰挤地铁时,耳机里传来的不再全是短视频的热闹声,越来越多人悄悄点开了播客
深夜加班改方案时,键盘声里混着的也不只是音乐,总有个温和的声音在聊职场困惑、讲冷门故事、甚至分享凌晨三点的失眠心事
现在只需要一篇文章地址就可以制作出来一个播客了,我们来看看工作流制作出来的播客效果如何

需求分析

这种工作流可以归属到音频处理类工作流,最核心的步骤就是读取文章、生成音频、合并音频了,大家有没有发现,其实只要找到需求的核心步骤,然后如果可以找到对应的插件,那么这个工作流就是可行的,如果找不到核心步骤的插件,那么就需要换种思路或者目前使用工作流就是完不成这样的任务
下面给出用户输入、工作流的实现步骤。
用户输入

1️⃣ 文章地址

工作流步骤

1️⃣ 定义用户输入

2️⃣ 读取链接内容

3️⃣ 大模型生成节目台词

4️⃣拆分男女对话

5️⃣生成音频

6️⃣合并音频元信息数组

7️⃣合成音频

8️⃣ 返回音频

工作流缩略图

图片

工作流拆解

第一步,定义用户输入

定义用户输入article_url,设置必填,用户需要给出需要制作播客的文章链接

图片

第二步,读取链接

使用插件读取网页内容,这里的读取是原文读取,就像是我们人一样浏览完链接跳转的文章,然后原封不动的复述出来文章的整段文本

图片

第三步,大模型生成节目台词

使用大模型节点根据文章内容生成节目的对话台词,注意这里的模型要选择DeepSeek-V3-2024,系统提示词和用户提示词不长,直接在下文给出

图片

第四步,拆分男女对话文案

将上一步大模型生成出来的台词拆分成男生文案和女生文案,因为大模型限制了返回的格式是
男:xxxx女:xxxx男:xxxx
所以先根据换行符拆开每一行,然后判断每一行的开始字符,以男开始则男生文案,以女开始则女生文案

图片

代码(Python)如下:

async def main(args: Args) -> Output:    params = args.params         lines =  params['input'].strip().split('\n')    # 初始化两个数组    male_lines = []    female_lines = []    # 遍历每一行,根据前缀将对白添加到对应的数组中    for line in lines:        if line.startswith('男:'):            male_lines.append(line[2:])        elif line.startswith('女:'):            female_lines.append(line[2:])        ret: Output = {        "male_lines": male_lines,        "female_lines": female_lines    }    return ret

第五步,生成对话音频

接着分别对男生文案和女生文案生成对应的音频

本次使用扣子官方的音频生成插件,相对于火山引擎的音频生成插件更好用一点,这里也想表达一点,并不是说某一个功能只能使用某一种特定的插件才可以实现,市面上有很多插件都可以达到一样的效果,得去靠自己测试后选择自己觉得最合适的插件

图片

将男生文案生成对应的男生音频,注意这里使用的是批处理,因为男生文案是一个数组,需要分段将文案制作语音

图片

将女生文案生成对应的女生音频

图片

这里有两个问题大家思考一下

第一个问题是为什么不直接将整段男生文案生成音频?

因为播客博客,就是以一问一答的方式,如果制作的是完整的文案语音,后续要需要对音频做拆分,相对于文案拆分来说就会很麻烦

第二个问题单独的批处理组件和插件自带的批处理有什么区别?为什么有时候使用插件自带的批处理,有时候需要使用单独的批处理

插件自带的批处理和单独的批处理组件本质上是一样的,都是同时执行任务,提高任务执行的效率,区别在于插件自带的批处理无法设置并行数量和最大并行数量。

至于什么时候用哪种方式,得看当前批处理的任务的子任务数量,如果当前的任务就是批量生成音频,没有其他任务了,那么使用插件自带的批处理就行了,这样看着还简洁一点,如果当前批处理的任务分为几个子任务,那么就一定需要使用单独的批处理节点,在批处理循环节点里面配置子任务。

第六步,合并音频元信息数组

得到男生和女生的音频后就可以将两者的语音穿插着放入到一个数组中,这里使用代码节点来完成这件事

图片

代码(JavaScript)如下:

async function main(params }: Args): Promise<Output> {    const mergedUrls = [];    const maxLength = Math.max(params.male_audio.length, params.female_audio.length);    for (let i = 0; i < maxLength; i++) {        if (i < params.audio.length) {            mergedUrls.push(params.male_audio[i].data.url);        }        if (i < params.audio_1.length) {            mergedUrls.push(params.female_audio[i].data.url);        }    }    const ret = {        mergedUrls    };    return ret;}

第七步,合并男女音频

光把地址合并可不行,还需要将地址对应的音频合并到一个音频中,使用插件merge_audios合并这些音频,返回合并后的音频地址

图片

第八步,返回合并后的音频地址

最后结束节点将上一步合并后的音频地址返回

图片

总结

大家一定要先明确完整的操作链路再开始写工作流,不然很有可能将一件简单的事情复杂化了,并且如果中间在写工作流的时候遇到了卡点,可以先从需求角度想一想是不是## 需求分析

错了,可不可以换一条路实现

就像本文对于男生女生音频的处理,是先拆分文案,再生成音频,如果是先生成完整音频再拆分男女生文案呢?两者虽然达到的效果是一样的,但是后者的操作难度比前者大得多了。

特大福利

通过以下链接注册插件平台用户,可以限时免费领取体验VIP!!!

www.miheai.com/?share_id=1…

图片

平台优势

✅免费剪映小助手

剪映小助手的工具下载地址如下:www.miheai.com/#/jianying?…

根据你电脑系统下载对应的版本即可

图片

✅优质插件

平台提供了非常多平时使用场景很多的插件,目前的插件列表如下

图片

我们的插件可以让你摆脱几大困境

❌ 价格昂贵

爆火的veo3插件:SVIP低至1.5元!!

图片

质量杠杠的即梦4.0图片生成:Svip低至0.14元!!!

图片

banana插件Svip低至0.09元!!!

图片

❌不稳定不好用

商店插件总是出岔子,平白无故浪费了很多token,而且也没有人维护,用起来真的很扎心,动不动就报错

我们的视频插件调用成功率99.7%!调用量7.8k!

并且我们有专业团队定期维护插件,保障每一位用户的插件调用成功率

图片

✅基础->高级->进阶->商用智能体课程

你想学到的这里都有,授人以鱼不如授人以渔,从案例入手拆解工作流的底层逻辑

图片

✅6000+各行业高质量提示词

现在平台提供6000+高质量各行业提示词,再也不用发愁提示词怎么写了!!

图片

本期的内容就到这里了,感谢你的耐心。

如果你有智能体定制,合作,学习智能体,学习智能体变现等需求,也可以找我。

图片

跟着文章的步骤实操,实现了这次的工作流,可以把结果放在评论区和大家分享!

做的过程中遇到了问题也可以评论区留言,我会为大家解答!

看完喜欢,请帮忙转发分享一下,你的点赞转发,就是我更新下去的动力!