刘悦的技术博客

刘悦的技术博客

刘悦的技术博客

刘悦的技术博客 v3u.cn

等 79 人订阅共161篇文章创建于2021-05-20

AI歌姬,C位出道,基于PaddleHub/Diffsinger实现音频歌声合成操作(Python3.10)

懂乐理的音乐专业人士可以通过写乐谱并通过乐器演奏来展示他们的音乐创意和构思，但不识谱的素人如果也想跨界玩儿音乐，那么门槛儿就有点高了。但随着人工智能技术的快速迭代，现在任何一个人都可以成为“创作型歌手

2年前
1.8k
5
评论

AI歌姬,C位出道,基于PaddleHub/Diffsinger实现音频歌声合成操作(Python3.10)

持续进化，快速转录，Faster-Whisper对视频进行双语字幕转录实践(Python3.10)

Faster-Whisper是Whisper开源后的第三方进化版本，它对原始的 Whisper 模型结构进行了改进和优化。这包括减少模型的层数、减少参数量、简化模型结构等，从而减少了计算量和内存消耗，

2年前
4.8k
18
1

持续进化，快速转录，Faster-Whisper对视频进行双语字幕转录实践(Python3.10)

栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜视频实践(Python3.10)

诸公可知目前最牛逼的TTS免费开源项目是哪一个？没错，是Bert-vits2，没有之一。它是在本来已经极其强大的Vits项目中融入了Bert大模型，基本上解决了VITS的语气韵律问题，在效果非常出色的

2年前
3.2k
17
评论

栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜视频实践(Python3.10)

铅华洗尽,粉黛不施,人工智能AI基于ProPainter技术去除图片以及视频水印(Python3.10)

视频以及图片修复技术是一项具有挑战性的AI视觉任务，它涉及在视频或者图片序列中填补缺失或损坏的区域，同时保持空间和时间的连贯性。该技术在视频补全、对象移除、视频恢复等领域有广泛应用。近年来，两种突出的

2年前
3.5k
6
评论

铅华洗尽,粉黛不施,人工智能AI基于ProPainter技术去除图片以及视频水印(Python3.10)

AIGC革新，将文字或者LOGO融入AI视频基于PIKA-labs(Python3.10)

很多平台都会禁止用户使用带有网址或者二维码的头像以及文章配图，这样可以有效的防止用户的一些“导流”行为。当然，头像、文章或者视频现在都是AI来审，毕竟现在人工的成本实在太高，但是如果我们把文字元素直接

2年前
1.6k
5
评论

AIGC革新，将文字或者LOGO融入AI视频基于PIKA-labs(Python3.10)

《卖炭翁》致敬河北程序员，初读已解诗中意，再读却是诗中人！

《我没有说话》是德国神学家马丁・尼莫拉牧师的忏悔诗，尽管他写的是自己，但这首诗却振聋发聩，发人深省，其描述忽视与表面上自己无关的团体所造成的结果。该诗后来常被引用，作为对事不关己高高挂起的

2年前
9.2k
97
26

《卖炭翁》致敬河北程序员，初读已解诗中意，再读却是诗中人！

基于TOTP算法的Github两步验证2FA(双因子)机制Python3.10/Golang1.21实现

从今年(2023)三月份开始，Github开始强制用户开启两步验证2FA(双因子)登录验证，毫无疑问，是出于安全层面的考虑，毕竟Github账号一旦被盗，所有代码仓库都会毁于一旦，关于双因子登录的必要

2年前
3.0k
5
评论

基于TOTP算法的Github两步验证2FA(双因子)机制Python3.10/Golang1.21实现

通用密钥,无需密码,在无密码元年实现Passkeys通用密钥登录(基于Django4.2/Python3.10)

毋庸讳言，密码是极其伟大的发明，但拜病毒和黑客所赐，一旦密码泄露，我们就得绞尽脑汁再想另外一个密码，但记忆力并不是一个靠谱的东西，一旦遗忘密码，也会造成严重的后果，2023年业界巨头Google已经率

2年前
3.9k
6
评论

通用密钥,无需密码,在无密码元年实现Passkeys通用密钥登录(基于Django4.2/Python3.10)

批量生成,本地推理，人工智能声音克隆框架PaddleSpeech本地批量克隆实践(Python3.10)

云端炼丹固然是极好的，但不能否认的是，成本要比本地高得多，同时考虑到深度学习的训练相对于推理来说成本也更高，这主要是因为它需要大量的数据、计算资源和时间等资源，并且对超参数的调整也要求较高，更适合在云

2年前
3.4k
7
评论

批量生成,本地推理，人工智能声音克隆框架PaddleSpeech本地批量克隆实践(Python3.10)

声音克隆,精致细腻,人工智能AI打造国师“一镜到底”鬼畜视频,基于PaddleSpeech(Python3.10)

电影《满江红》上映之后，国师的一段采访视频火了，被无数段子手恶搞做成鬼畜视频，诚然，国师的这段采访文本相当经典，他生动地描述了一个牛逼吹完，大家都信了，结果发现自己没办法完成最后放弃，随后疯狂往回找补

2年前
3.4k
12
1

声音克隆,精致细腻,人工智能AI打造国师“一镜到底”鬼畜视频,基于PaddleSpeech(Python3.10)

南洋才女,德艺双馨,孙燕姿本尊回应AI孙燕姿(基于Sadtalker/Python3.10)

孙燕姿果然不愧是孙燕姿，不愧为南洋理工大学的高材生，近日她在个人官方媒体博客上写了一篇英文版的长文，正式回应现在满城风雨的“AI孙燕姿”现象，流行天后展示了超人一等的智识水平，行文优美，绵恒隽永

3年前
6.6k
24
3

南洋才女,德艺双馨,孙燕姿本尊回应AI孙燕姿(基于Sadtalker/Python3.10)

音容笑貌,两臻佳妙,人工智能AI换脸(deepfake)技术复刻《卡萨布兰卡》名场面(Python3.10)

影史经典《卡萨布兰卡》是大家耳熟能详的传世名作，那一首壮怀激烈，激奋昂扬的马赛曲，应当是通片最为激动人心的经典桥段了，本次我们基于faceswap和so-vits库让AI川普复刻美国演员保罗·亨雷德

3年前
5.0k
11
评论

音容笑貌,两臻佳妙,人工智能AI换脸(deepfake)技术复刻《卡萨布兰卡》名场面(Python3.10)

声音好听,颜值能打,基于PaddleGAN给人工智能AI语音模型配上动态画面(Python3.10)

借助So-vits我们可以自己训练五花八门的音色模型，然后复刻想要欣赏的任意歌曲，实现点歌自由，但有时候却又总觉得少了点什么，没错，缺少了画面，只闻其声，却不见其人，本次我们让AI川普的歌声和他伟岸的

3年前
3.7k
9
评论

声音好听,颜值能打,基于PaddleGAN给人工智能AI语音模型配上动态画面(Python3.10)

云端炼丹,算力白嫖,基于云端GPU(Colab)使用So-vits库制作AI特朗普演唱《国际歌》

人工智能AI技术早已深入到人们生活的每一个角落，君不见AI孙燕姿的歌声此起彼伏，不绝于耳，但并不是每个人都拥有一块N卡，没有GPU的日子总是不好过的，但是没关系，山人有妙计，本次我们基于Google的

3年前
3.7k
8
1

云端炼丹,算力白嫖,基于云端GPU(Colab)使用So-vits库制作AI特朗普演唱《国际歌》

Python3.10动态修改Windows系统(win10/win11)本地IP地址(静态IP)

一般情况下，局域网里的终端比如本地服务器设置静态IP的好处是可以有效减少网络连接时间，原因是过程中省略了每次联网后从DHCP服务器获取IP地址的流程，缺点是容易引发IP地址的冲突，当然，还有操作层面的

3年前
3.3k
7
3

Python3.10动态修改Windows系统(win10/win11)本地IP地址(静态IP)

AI天后,在线飙歌,人工智能AI孙燕姿模型应用实践，复刻《遥远的歌》，原唱晴子(Python3.10)

忽如一夜春风来，亚洲天后孙燕姿独特而柔美的音色再度响彻华语乐坛，只不过这一次，不是因为她出了新专辑，而是人工智能AI技术对于孙燕姿音色的完美复刻，以大江灌浪之势对华语歌坛诸多经典作品进行了翻唱，还原度

3年前
5.2k
24
5

AI天后,在线飙歌,人工智能AI孙燕姿模型应用实践，复刻《遥远的歌》，原唱晴子(Python3.10)

极速进化,光速转录,C++版本人工智能实时语音转文字(字幕/语音识别)Whisper.cpp实践

业界良心OpenAI开源的Whisper模型是开源语音转文字领域的执牛耳者，白璧微瑕之处在于无法通过苹果M芯片优化转录效率，Whisper.cpp 则是 Whisper 模型的 C/C++ 移植版本

3年前
5.6k
12
8

极速进化,光速转录,C++版本人工智能实时语音转文字(字幕/语音识别)Whisper.cpp实践

人工智能AI图像风格迁移(StyleTransfer),基于双层ControlNet(Python3.10)

图像风格迁移（Style Transfer）是一种计算机视觉技术，旨在将一幅图像的风格应用到另一幅图像上，从而生成一幅新图像，该新图像结合了两幅原始图像的特点，目的是达到一种风格化叠加的效果

3年前
4.1k
25
评论

人工智能AI图像风格迁移(StyleTransfer),基于双层ControlNet(Python3.10)

任务拆解,悠然自得,自动版本的ChatGPT,AutoGPT自动人工智能AI任务实践(Python3.10)

当我们使用ChatGPT完成某些工作的时候，往往需要多轮对话，比如让ChatGPT分析、翻译、总结一篇网上的文章或者文档，再将总结的结果以文本的形式存储在本地。过程中免不了要和ChatGPT“折冲樽俎

3年前
4.0k
49
评论

任务拆解,悠然自得,自动版本的ChatGPT,AutoGPT自动人工智能AI任务实践(Python3.10)

人工智能AI库Spleeter免费人声和背景音乐分离实践(Python3.10)

在视频剪辑工作中，假设我们拿到了一段电影或者电视剧素材，如果直接在剪辑的视频中播放可能会遭遇版权问题，大部分情况需要分离其中的人声和背景音乐，随后替换背景音乐进行二次创作，人工智能AI库Spleete

3年前
5.4k
46
1

人工智能AI库Spleeter免费人声和背景音乐分离实践(Python3.10)