ChatTTS产品实践及变现思路(有安装教程、一键部署包)

310 阅读4分钟

背景

程序员失业在家(第一天),感觉自己非常慌,但是目前也不知道自己能干啥,但是程序员嘛,你懂的,技术还是有一点,正好最近的文本转语音模型ChatTTS非常火热,那我就去研究一下,如果它作为一个产品级的应用,或者工具它能有什么样的可能性呢?

为什么ChatTTS这么火?

我们都知道TTS的要干的事情就是让机器将文本转成语音,所以这门技术的追求一直都是让机器说人话,但是人是有情感的,人在说话的时候往往会伴随着语气助词、停顿等,想要很好的表达出人的情感并不容易,所以之前的一些TTS能实现将文本转语音,但是对情感的处理并没有那么细腻!

那ChatTTS有什么亮点呢?

  1. 对话式 TTS: ChatTTS针对对话式任务进行了优化,实现了自然流畅的语音合成,同时支持多说话人。

  2. 细粒度控制: 该模型能够预测和控制细粒度的韵律特征,包括笑声、停顿和插入词等。

  3. 更好的韵律: ChatTTS在韵律方面超越了大部分开源TTS模型。同时提供预训练模型,支持进一步的研究。

注:以上内容引用ChatTTS官网

ChatTT的一些变现思路

视频自媒体配音

现在自媒体非常的火热,但是很多朋友呢他在做自媒体的时候,苦于没办法去做配音,或者是他觉得自己的声音不好听。所以这也是一个门槛,很多人因此就放弃了,那正好现在呢就出了这么一个产品,它就能解决这一部分同学目前所存在的问题。当我们选好一个主题以后,开始写文案,然后同时就把一些需要加的语气词、停顿等全部加好,这时候我们的效率就会非常高,也不用去配音,全部让AI帮我们生成,有了它日更不是梦。

有声小说

在以前做有声小说的时候,我们需要请很人去配音演员,配音员,配音演员在拿到小说文本以后,需要先熟悉小说的故事走向,进行情感路线的一个梳理,然后还要进行一定的排练,才能富有感情的将小说读出来。如果小说的叙事比较庞大,涉及到的人数比较多的话,那可能周期会非常的长,才能达到理想的效果,这样的制作方式非常的耗时耗力,且成本高昂,但在有了这个ChatTTS以后,我们可以使用多人AI角色的方式去给小说配音,然后再赋予它一些特别的停顿、语气、情感表达。这样子的话,我们做出来的东西就会成本非常的低,然后产出效率非常的高,适合批量的去生产,有了这个chatTTS以后,我们就几乎不太需要有任何的成本投入,最多就需要小说的授权,那这个时候我们很多的普通人都可以去尝试,因为它几乎是零成本,这也是我们做自媒体或者是副业的一个考虑的一个方向。

有声儿童漫画视频

前段时间在小红书上有很多自媒体博主使用midjourney或其他的一些AI图片生成工具,生成儿童的漫画,然后再加上一些简单配音去生成儿童的漫画视频,前段时间这种类型的视频在小红书上非常的火热,也成为了很多博主的一个变现手段,但是他们的配音及其简单,那现在有了ChatTTS的一个加持,我们可以把把它做的更好,我们可以给不同的漫画角色赋予不同的人物配音,这时候我们做出来的东西就比别人更加的吸引人,我觉得这也是一个非常好的赛道

数字人+ChatTTS

同时最近数字人直播也非常的火,但是呢数字人直播有一个很大的问题,就是他没办法去表达人类的丰富的情感。所以很多数字人只不过看起来就非常的僵硬。那现在有了ChasTTS以后我们可以给数字人赋予一些情丰富的情感表达,让数字人看起来更逼真,更接近我们想要表达的效果。

最后

安装教程请参看博主零度解说的安装教程,教程已经有了一键部署包,下载下来直接就能用,地址:https://www.freedidi.com/12621.html