首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
ai2audio
订阅
缘生
更多收藏集
微信扫码分享
微信
新浪微博
QQ
26篇文章 · 0订阅
新型轻量级音频模型问世!1.5B参数挑战 Whisper 与 Qwen2-Audio!
随着语音助手、会议转写等应用的普及,轻量级、高性能的音频模型需求也日益增长。 Aero-1-Audio 是一款新型的1.5B参数音频模型,由 LMMs-Lab 开发,基于 Qwen-2.5-1.5B
Zonos:油管博主集体转粉!开源TTS神器Zonos爆火:克隆你的声音说5国语言,还能调喜怒哀乐
Zonos 是 ZyphraAI 推出的开源多语言 TTS 模型,支持语音克隆、情感控制和多种语言,适用于有声读物、虚拟助手等场景。
刚刚开源的新型TTS模型:Zonos!最低5s即可克隆高质量语音!
近期又发现一款刚开源的新型高保真 TTS 模型:Zonos。开源不到5天,已经在 GitHub 上收获了 1.1k 标星。 无论是快速生成特定情绪的语音,还是精准地模拟特定人的语音,它都能轻松搞定。
Voice-Pro:开源AI音频处理工具,集成转录、翻译、TTS等一站式服务
Voice-Pro是一款开源的多功能音频处理工具,集成了语音转文字、文本转语音、实时翻译、YouTube视频下载和人声分离等多种功能。
i人的福音!一个强大开源的文本转语音工具!
EmotiVoice —— 一个强大的开源 TTS 引擎(Text To Speech,即文本转语音),完全免费开源!
10K star!免费离线的语音转文字工具,远超垃圾付费软件
今天我们介绍的开源项目,可以免费进行视频/音频转录文字,也支持实时语音转文字,并且离线可用,帮助打工人提升效率,它就是:buzz
语言模型 F5-E2 TTS:音色 & 情绪一键克隆,轻松实现多角色对话
F5-TTS 是由上海交通大学、剑桥大学和吉利汽车研究院(宁波)有限公司于 2024 年共同开源的一款高性能文本到语音 (TTS) 系统,它基于流匹配的非自回归生成方法,结合了扩散变换器 (DiT)
15.1K Star!Fish Speech 1.5 正式上线!全球领先的多语言 TTS 工具!可本地部署“调教”。
如果说语音合成是未来 AI 的一个重要分支,那么 Fish Speech 1.5 的发布毫无疑问让这一领域变得更加精彩。 作为新一代的 TTS 工具,这款模型不仅在准确性、稳定性和跨语言能力上遥遥领先
F5-TTS集成包:Windows平台下的快速部署与应用
F5-TTS 是一款先进的文本转语音系统,它使用深度学习技术生成逼真、高质量的人声。只需短短10秒的音频样本,就能克隆出你的声音。F5-TTS 能够准确再现语音,并赋予其丰富的感情色彩。 Window
6K star!这款TTS效果太炸裂,网上的声音真不能乱信了
今天我们分享一个开源TTS项目,它可以快速克隆声音,效果非常的炸裂,可以满足用户的个性化需求,它就是:Fish Speech