首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
ai 声频
订阅
WingDust
更多收藏集
微信扫码分享
微信
新浪微博
QQ
31篇文章 · 0订阅
刚刚开源的新型TTS模型:Zonos!最低5s即可克隆高质量语音!
近期又发现一款刚开源的新型高保真 TTS 模型:Zonos。开源不到5天,已经在 GitHub 上收获了 1.1k 标星。 无论是快速生成特定情绪的语音,还是精准地模拟特定人的语音,它都能轻松搞定。
新型轻量级音频模型问世!1.5B参数挑战 Whisper 与 Qwen2-Audio!
随着语音助手、会议转写等应用的普及,轻量级、高性能的音频模型需求也日益增长。 Aero-1-Audio 是一款新型的1.5B参数音频模型,由 LMMs-Lab 开发,基于 Qwen-2.5-1.5B
Kimi-Audio:月之暗面开源音频大模型,1300万小时训练重塑语音交互
Kimi-Audio是月之暗面推出的开源音频基础模型,基于1300万小时多样化音频数据训练,采用混合输入架构和流式解码技术,支持语音识别、情感分析等十余种音频处理任务。
开源TTS领域迎来重磅新星!Dia-1.6B:超逼真对话生成,开源2天斩获6.5K Star!
文本转语音(TTS)领域又迎来一位重磅新星! 由 Nari Labs 开发的 Dia-1.6B 以其超逼真的对话生成能力引发热议,仅开源两天便在 GitHub 收获 6.5K+ Star! 据说其能力
阿里开源语音大模型CosyVoice:3秒还原声音,从部署到克隆的完整指南
前言 很久之前就想给大家介绍声音克隆开源项目GPT-SoVITS ,但是看到视频教程过于复杂了,最近又出现了一个剪辑《人民的名义》的短视频非常搞笑,先给大家看下这个视频: https://v.douy
ChatTTS!可生成音效非常自然逼真的开源语音大模型
说起**文生语音模型**,最广为人知的肯定是 **OpenAI 的 Whisper**,之前试过确实
CosyVoice支持多语言、音色和情感控制,one-shot零样本语音克隆模型本地部署(Win/Mac),通义实验室开源
平心而论,CosyVoice不愧是大厂出品,模型的品质没的说,代表了国内AI的最高水准,通义实验室名下无虚,当然,如果能将工程化之后的代码也开源出来,那就更好了,相信经过libtorch的优化
一款新型开源TTS模型,小白都能无压力上手,还有海量音色模型可选择。
TTS 语音模型我们都不陌生,前段时间一夜火爆的ChatTTS模型更是效果炸裂,很多人都更换了常用的语音生成模型,转而使用它。 而今天再次为大家介绍一款新型的TTS语言生成模型工具-FishSpeec
js演奏大师
简介 Tone.js-Instruments 是github上的一个开源项目,此项目神奇之处在于,他并非处理我们常见的业务场景,而是一个基于音频文件调度来实现演奏乐器功能的基础库,我们可以利用其在很短
五步实现你的出海AI生成音乐网站,开源啦~
清明卷一卷,一个接入登录、注册支付的音乐生成AI网站写好了,开源啦!!只要五步,手把手实现部署好一个AI音乐生成网站