👩💻 hi~ 我是思齐,一只大厂程序媛。我的教程 《AI智能体开发扣子(Coze)实战教程》 正在免费开放中,请关注公众号获取,同时免费加群,和1000+AI开发者一起讨论问题,分享开发技巧!
🙅AI数字人口播神器来了🔥🔥。 1分钟生成专业级带货 or 科普视频,支持50+真人形象定制,免剪辑直出4K高清画质,零基础小白也能轻松上手,3分钟节省百万主播费用💰💰。
下面跟着思齐,一步一步实现自己的数字人吧:
- 输入文案
- 选择数字人形象
- 自动生成视频
📪 首先我们来看一下生成数字人的效果:
<div style="position: relative; padding: 30% 45%;">
<iframe style="position: absolute; width: 100%; height: 100%; left: 0; top: 0;" src="https://res.chanjing.cc/chanjing/prod/dhaio/output/2025-05-20/1924752100026220544-1747731734-output.mp4" frameborder="no" scrolling="no"></iframe>
</div>
💖点赞收藏这篇教程,下次遇到报错时,能快速找到解决方案,而且也不会错过我后面的教程。🤹 接下来,话不多说,思齐用最简单的方式教给大家。
一步一步搭建工作流
💜工作流概览
-
开始节点
开始节点中设置要配音的文字或者是查询已经配好的数字人视频。
-
设置意图识别节点
这里来判断输入是文本还是数字人视频id,之后分别为这两个逻辑走不同的逻辑分支。
📌这里是重点:
记得设置下面的系统提示词,因为我自己尝试过只设置意图匹配,容易出现识别错误的现象,加入系统提示词之后,进行双保证,识别再也没有错过。
-
设置获取数字人列表节点
库里大约有50种数字人类型,这里可以先获取所有的类型,然后交给用户来选择用哪一种。
-
设置数字人选项
把获取到的数字人类型列成列表格式给到用户做选择。
这里用代码来处理一下格式。
async function main({ params }: Args): Promise<Output> {
const list = params.list;
const options = [];
for (let i = 0; i < 30; i++) {
options.push(list[i].name+":"+list[i].audio_name);
}
// 构建输出对象
const ret = {
"options": options
};
return ret;
}
5. ## 设置数字人选择节点
这里的作用是向用户展示
设置回答类型是“选项回答”。
内容选项是“动态内容”。
-
设置组装数据格式节点
将数字人列表、要配音的文本、用户选择的数字人id三个数据组装成插件需要的格式
这里用代码来格式化一下数据。
personList 输入获取到的数字人选项 text 输入 开始节点的query 文本 optionContent 输入 选择的数字人id
对应的代码
async function main({ params }: Args): Promise<Output> {
const text = params.text;
const personList = params.personList;
const optionContent = params.optionContent;
const optionName = params.optionContent.split(":")[0]
let result = {}
for (let i = 0; i < personList.length; i++) {
if (personList[i].name == optionName) {
result = {
"audio_man_id": personList[i]["audio_man_id"],
"bg": 1,
"figure_type": personList[i]["figures"][0].type,
"person_id": personList[i]["id"],
"text": text,
"width": 1080,
"height": 1920,
"index": i,
"name": personList[i].name
}
break
}
}
const ret = {
"result": result,
};
return ret;
}
-
设置合成数字人节点
将之前组装好的数据一一对应输入到数字人插件中。
这里用到的插件是“合成禅镜数字人视频”
到这里合成数字人的步骤就完成了!
-
设置获取数字人生成进度节点
一般合成数字人后要等待1-5分钟,要配音的文字越长,等待的时间越久。
这里设置一个节点查询下生成进度。
-
设置文本处理节点
格式一下获取到的进度信息
-
设置变量聚合节点
将所有获取到的信息组合一下,输出给结束节点
-
设置结束节点
输出一下信息就结束了
🚩到这里,生成数字人的智能体就搭建好了,大家快动手试试吧🌟🌟。
🔎 可能出现的问题
- 现象:系统无法正确区分文本输入和视频ID
- 解决方案:检查系统提示词是否完整,建议同时设置系统提示词,实现"意图匹配+提示词"双保险机制
- 现象:获取不到50种数字人选项
- 解决方案:检查API连接状态,确认权限设置,建议添加错误重试机制
- 现象:输入文本但是返回为空
- 解决方案:确认文本长度是否超限(建议控制在500字内),检查网络延迟
- 现象:非中文文本发音错误
- 解决方案:确认数字人是否支持目标语种,检查文本编码格式
👉大家好,我是思齐,专注AI智能体领域的知识分享,请关注我,和我一起学习吧。
我的🌟 《AI智能体开发扣子(Coze)实战教程》🌟也为大家免费开放,可以通过我的公众号和网站进行学习,关注我获得免费教程地址📌。