刘悦的技术博客

刘悦的技术博客

刘悦的技术博客

刘悦的技术博客 v3u.cn

等 79 人订阅共161篇文章创建于2021-05-20

如何在GitHub正确提PR(Pull Requests),给喜欢的开源项目贡献代码

最好的中文TTS项目Bert-vits2更新了中文特化分支，但可能由于时间仓促，代码中存在不少的bug，作为普通用户，有的时候也想为自己喜欢的开源项目做一点点贡献，帮助作者修改一些简单的bug

2年前
3.1k
5
1

如何在GitHub正确提PR(Pull Requests),给喜欢的开源项目贡献代码

首次引入大模型!Bert-vits2-Extra中文特化版40秒素材复刻巫师3叶奈法

Bert-vits2项目又更新了，更新了一个新的分支：中文特化，所谓中文特化，即针对中文音色的特殊优化版本，纯中文底模效果百尺竿头更进一步，同时首次引入了大模型，使用国产IDEA-CCNL/Erlan

2年前
3.0k
4
评论

首次引入大模型!Bert-vits2-Extra中文特化版40秒素材复刻巫师3叶奈法

字正腔圆,万国同音,coqui-ai TTS跨语种语音克隆,钢铁侠说16国语言(Python3.10)

按照固有的思维方式，如果想要语音克隆首先得有克隆对象具体的语言语音样本，换句话说，克隆对象必须说过某一种语言的话才行，但现在，coqui-ai TTS V2.0版本做到了，真正的跨语种无需训练的语音克

2年前
2.0k
6
1

字正腔圆,万国同音,coqui-ai TTS跨语种语音克隆,钢铁侠说16国语言(Python3.10)

丝丝入扣,毫不违和,AI一键换脸和微调,基于Rope-Ruby,2024最新整合包

AI换脸已经不是什么时新的技术了，从DeepFace到Facesweap，再到Roop。AI换脸技术中出现了一种名为“一键换脸”的方法，它不需要训练模型。这种方法利用了名为“GHOST”的技术，它是一

2年前
2.6k
3
评论

丝丝入扣,毫不违和,AI一键换脸和微调,基于Rope-Ruby,2024最新整合包

Win11环境Mecab日语分词和词性分析以及动态库DLL not found问题(Python3.10）

日语因为存在假名，会导致翻译软件进行翻译时机翻味道过重的问题，比如積ん読（つんどく）这个词，大多数软件会翻译成：堆积的读，但其实是明明买了书却不读，光放着的意思。有时候也需要单独查句子中的单词释义来理

2年前
1.7k
2
评论

Win11环境Mecab日语分词和词性分析以及动态库DLL not found问题(Python3.10）

一键打包,随时运行,Python3项目虚拟环境一键整合包的制作(Venv)

之前我们介绍了如何使用嵌入式 Python3 环境给项目制作一键整合包，在使用嵌入式 Python 环境时，通常是作为另一个应用程序的一部分，而Python3虚拟环境是为了在开发过程中隔离项目所需的

2年前
2.4k
7
评论

一键打包,随时运行,Python3项目虚拟环境一键整合包的制作(Venv)

免费背景音人声分离解决方案MVSEP-MDX23,足以和Spleeter分庭抗礼

在音视频领域，把已经发布的混音歌曲或者音频文件逆向分离一直是世界性的课题。音波混合的物理特性导致在没有原始工程文件的情况下，将其还原和分离是一件很有难度的事情。言及背景音人声分离技术，就不能不提

2年前
2.4k
5
1

免费背景音人声分离解决方案MVSEP-MDX23,足以和Spleeter分庭抗礼

Bert-vits2最终版Bert-vits2-2.3云端训练和推理(Colab免费GPU算力平台)

对于深度学习初学者来说，JupyterNoteBook的脚本运行形式显然更加友好，依托Python语言的跨平台特性，JupyterNoteBook既可以在本地线下环境运行，也可以在线上服务器上运行。

2年前
1.3k
2
评论

Bert-vits2最终版Bert-vits2-2.3云端训练和推理(Colab免费GPU算力平台)

Bert-vits2-2.3-Final，Bert-vits2最终版一键整合包(复刻生化危机艾达王)

近日，Bert-vits2发布了最新的版本2.3-final，意为最终版，修复了一些已知的bug，添加基于 WavLM 的 Discriminator（来源于 StyleTTS2），令人意外的是，因

2年前
2.1k
5
评论

Bert-vits2-2.3-Final，Bert-vits2最终版一键整合包(复刻生化危机艾达王)

云端开炉,线上训练,Bert-vits2-v2.2云端线上训练和推理实践(基于GoogleColab)

对于笔者这样的穷哥们来讲，GoogleColab就是黑暗中的一道光，就算有训练时长限制，也能凑合用了，要啥自行车？要饭咱也就别嫌饭馊了，本次我们基于GoogleColab在云端训练和推理Bert-vi

2年前
1.7k
4
评论

云端开炉,线上训练,Bert-vits2-v2.2云端线上训练和推理实践(基于GoogleColab)

Bert-vits2-v2.2新版本本地训练推理整合包(原神八重神子英文模型miko)

近日，Bert-vits2-v2.2如约更新，该新版本v2.2主要把Emotion 模型换用CLAP多模态模型，推理支持输入text prompt提示词和audio prompt提示语音来进行引导风格

2年前
1.5k
4
评论

Bert-vits2-v2.2新版本本地训练推理整合包(原神八重神子英文模型miko)

衡兰芷若成绝响,人间不见周海媚(4k修复基于PaddleGan)

一代人有一代人的经典回忆，1994年由周海媚、马景涛、叶童主演的《倚天屠龙》曾经风靡一时，周海媚所诠释的周芷若凝聚了汉水之钟灵，峨嵋之毓秀，遇雪尤清，经霜更艳，俘获万千观众，成为了一代人的共同记忆。

2年前
1.3k
6
5

衡兰芷若成绝响,人间不见周海媚(4k修复基于PaddleGan)

两亿大奖,一夜暴富,江西彩票、概率学、阴谋论暨景观社会

近日，中国福彩“快乐8”选七玩法中有一人投注近5万倍共中2.2亿余元，两个小目标，一夜全自由，如果你以为这是故事，那么你错了，如果你以为这是生活，那么我们都错了。

2年前
7.7k
24
58

两亿大奖,一夜暴富,江西彩票、概率学、阴谋论暨景观社会

Bert-vits2新版本V2.1英文模型本地训练以及中英文混合推理(mix)

中英文混合输出是文本转语音(TTS)项目中很常见的需求场景，尤其在技术文章或者技术视频领域里，其中文文本中一定会夹杂着海量的英文单词，我们当然不希望AI口播只会念中文，Bert-vits2老版本

2年前
2.8k
5
评论

Bert-vits2新版本V2.1英文模型本地训练以及中英文混合推理(mix)

义无反顾马督工,Bert-vits2V210复刻马督工实践(Python3.10)

Bert-vits2更新了版本V210，修正了日/英的bert对齐问题，效果进一步优化；对底模使用的数据进行优化和加量，减少finetune失败以及电音的可能性；日语bert更换了模型，完善了多语言推

2年前
1.4k
7
1

义无反顾马督工,Bert-vits2V210复刻马督工实践(Python3.10)

本地训练,立等可取,30秒音频素材复刻霉霉讲中文音色基于Bert-VITS2V2.0.2

之前我们使用Bert-VITS2V2.0.2版本对现有的原神数据集进行了本地训练，但如果克隆对象脱离了原神角色，我们就需要自己构建数据集了，事实上，深度学习模型的性能和泛化能力都依托于所使用的数据集的

2年前
2.6k
12
1

本地训练,立等可取,30秒音频素材复刻霉霉讲中文音色基于Bert-VITS2V2.0.2

本地训练,开箱可用,Bert-VITS2 V2.0.2版本本地基于现有数据集训练(原神刻晴)

按照固有思维方式，深度学习的训练环节应该在云端，毕竟本地硬件条件有限。但事实上，在语音识别和自然语言处理层面，即使相对较少的数据量也可以训练出高性能的模型，对于预算有限的同学们来说，也没必要花冤枉钱上

2年前
2.1k
4
评论

本地训练,开箱可用,Bert-VITS2 V2.0.2版本本地基于现有数据集训练(原神刻晴)

又欲又撩人,基于新版Bert-vits2V2.0.2音色模型雷电将军八重神子一键推理整合包分享

Bert-vits2项目近期炸裂更新，放出了v2.0.2版本的代码，修正了存在于2.0先前版本的重大bug，并且重炼了底模，本次更新是即1.1.1版本后最重大的更新，支持了三语言训练及混合合成，并且做

2年前
1.7k
5
评论

又欲又撩人,基于新版Bert-vits2V2.0.2音色模型雷电将军八重神子一键推理整合包分享

一键整合,万用万灵,Python3.10项目嵌入式一键整合包的制作(Embed)

我们知道Python是一门解释型语言，项目运行时需要依赖Python解释器，并且有时候需要安装项目中对应的三方依赖库。对于专业的Python开发者来说，可以直接通过pip命令进行安装即可。但是如果是分

2年前
2.0k
6
1

一键整合,万用万灵,Python3.10项目嵌入式一键整合包的制作(Embed)

不懂乐理,也能扒谱,基于openvpi将mp3转换为midi乐谱(Python3.10)

扒谱的目的是为了更好地理解和演奏音乐作品，从中学习技巧、乐曲结构和艺术表达等方面。但不懂乐理的人很难听出音符和音准，本次我们通过openvpi的开源项目some来直接针对mp3文件进行扒谱

2年前
2.0k
4
1

不懂乐理,也能扒谱,基于openvpi将mp3转换为midi乐谱(Python3.10)