使用豆包大模型为音视频生成字幕

683 阅读1分钟

下载地址

pyvideotrans.com/downpackage

程序比较大,下载的同时可以把火山引擎账号给注册了

然后登录,进入到语音识别控制台

console.volcengine.com/speech/app

下拉找到“音视频字幕生成”

image.png

然后创建应用

image.png

选中“音视频字幕生成”,如果其他功能需要使用可以自行勾选

image.png 点击确定,继续下一步“获取 APP ID 和 Access Token”

image.png

image.png

默认创建的是试用版,有20个小时的免费时长,也可开通正式后付费版

点击开通,转为后付费正式版。

image.png

然后就可以开始使用了,选定豆包,然后拖放视频到程序

image.png

识别完成后点击打开保存目录就能看到对应的字幕文件了

image.png

不同语言都好用

image.png