ai2audio - 缘生的收藏集 - 掘金

ai2audio

更多收藏集

27篇文章 · 0订阅

纯干货！3分钟教你免费克隆任何声音！

最近这几个月，数字人和短视频配音简直火得一塌糊涂。很多朋友在做视频的时候都会遇到一个痛点：平台提供的那些默认音色，听起来不是太生硬，就是早就被大家听腻了，完全没个性。想要自己的视频出彩，声音克隆就是

Java中文社群
4月前
1.1k
17
1

纯干货！3分钟教你免费克隆任何声音！

新型轻量级音频模型问世！1.5B参数挑战 Whisper 与 Qwen2-Audio！

随着语音助手、会议转写等应用的普及，轻量级、高性能的音频模型需求也日益增长。 Aero-1-Audio 是一款新型的1.5B参数音频模型，由 LMMs-Lab 开发，基于 Qwen-2.5-1.5B

开源星探
1年前
715
1
评论

Zonos：油管博主集体转粉！开源TTS神器Zonos爆火：克隆你的声音说5国语言，还能调喜怒哀乐

Zonos 是 ZyphraAI 推出的开源多语言 TTS 模型，支持语音克隆、情感控制和多种语言，适用于有声读物、虚拟助手等场景。

蚝油菜花
1年前
776
7
评论

Zonos：油管博主集体转粉！开源TTS神器Zonos爆火：克隆你的声音说5国语言，还能调喜怒哀乐

刚刚开源的新型TTS模型：Zonos！最低5s即可克隆高质量语音！

近期又发现一款刚开源的新型高保真 TTS 模型：Zonos。开源不到5天，已经在 GitHub 上收获了 1.1k 标星。无论是快速生成特定情绪的语音，还是精准地模拟特定人的语音，它都能轻松搞定。

开源星探
1年前
947
9
评论

Voice-Pro：开源AI音频处理工具，集成转录、翻译、TTS等一站式服务

Voice-Pro是一款开源的多功能音频处理工具，集成了语音转文字、文本转语音、实时翻译、YouTube视频下载和人声分离等多种功能。

蚝油菜花
1年前
830
4
评论

Voice-Pro：开源AI音频处理工具，集成转录、翻译、TTS等一站式服务

i人的福音！一个强大开源的文本转语音工具！

EmotiVoice —— 一个强大的开源 TTS 引擎（Text To Speech，即文本转语音），完全免费开源！

Java陈序员
1年前
3.3k
30
2

i人的福音！一个强大开源的文本转语音工具！

10K star！免费离线的语音转文字工具，远超垃圾付费软件

今天我们介绍的开源项目，可以免费进行视频/音频转录文字，也支持实时语音转文字，并且离线可用，帮助打工人提升效率，它就是：buzz

IT咖啡馆
2年前
8.7k
75
16

10K star！免费离线的语音转文字工具，远超垃圾付费软件

语言模型 F5-E2 TTS：音色 & 情绪一键克隆，轻松实现多角色对话

F5-TTS 是由上海交通大学、剑桥大学和吉利汽车研究院（宁波）有限公司于 2024 年共同开源的一款高性能文本到语音 (TTS) 系统，它基于流匹配的非自回归生成方法，结合了扩散变换器 (DiT)

小白狮ww
1年前
576
点赞
评论

语言模型 F5-E2 TTS：音色 & 情绪一键克隆，轻松实现多角色对话

15.1K Star！Fish Speech 1.5 正式上线！全球领先的多语言 TTS 工具！可本地部署“调教”。

如果说语音合成是未来 AI 的一个重要分支，那么 Fish Speech 1.5 的发布毫无疑问让这一领域变得更加精彩。作为新一代的 TTS 工具，这款模型不仅在准确性、稳定性和跨语言能力上遥遥领先

开源星探
1年前
2.3k
17
4

F5-TTS集成包：Windows平台下的快速部署与应用

F5-TTS 是一款先进的文本转语音系统，它使用深度学习技术生成逼真、高质量的人声。只需短短10秒的音频样本，就能克隆出你的声音。F5-TTS 能够准确再现语音，并赋予其丰富的感情色彩。 Window

mortimer
1年前
1.8k
点赞
评论

F5-TTS集成包：Windows平台下的快速部署与应用