首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
ai 声频
订阅
WingDust
更多收藏集
微信扫码分享
微信
新浪微博
QQ
38篇文章 · 0订阅
很顶!零成本克隆你的声音,这款B站开源神器太强了
今天分享的内容,只有两个字形容:很顶。 本期我们要干一件大事:在本地电脑上部署 B 站开源的顶流 TTS(语音合成)大模型,并结合 N8N 实现自动化调用。 为什么要折腾本地部署?原因很简单,被云端
“音”你而变:Step-Audio-EditX,音频编辑的“魔法”新纪元!
朋友们,想象一下,如果你能像修图一样,随心所欲地“P”声音,那会是怎样一番景象?过去,这听起来像是科幻,但现在,阶跃星辰(StepFun)带来的Step-Audio-EditX,正在把这个梦想变为现实
“小钢炮”驾到!VoxCPM:0.5B参数,震撼AI语音圈
最近,AI圈子里又炸开了锅。当大家还在追逐那些动辄千亿参数的语言大模型时,面壁智能和清华大学深圳国际研究生院人机语音交互实验室却悄悄扔出了一枚“小钢炮”——VoxCPM语音生成模型。这模型
抄了AI语音克隆的家!本地部署、6G显存搞定、一键启动包免费放送
今天给大家带来几款AI语音克隆技术的硬核分享,包括本地部署教程,还有超方便的一键启动整合包。无论你是技术小白还是资深玩家,这篇干货都能让你轻松上手,克隆出属于自己的专属语音! 1. Index-TTS
CosyVoice 2.0:阿里开源升级版语音生成大模型,支持多语言和跨语言语音合成,提升发音和音色等的准确性
CosyVoice 2.0 是阿里巴巴通义实验室推出的语音生成大模型升级版,通过有限标量量化技术和块感知因果流匹配模型,显著提升了发音准确性、音色一致性和音质,支持多语言和流式推理。
【语音合成】B 站开源 IndexTTS :声音克隆,吊打真人发音,断句精准度 98%
IndexTTS 是哔哩哔哩(B 站)推出的工业级文本转语音(TTS)系统,基于开源项目 XTTS 和 Tortoise 深度优化,融合了类 GPT 的生成架构与中文场景的针对性创新。
TTS模型也要过年了!又一款超逼真TTS模型发布,还支持带情感的语音克隆!
最近,TTS 模型领域也真的是要过年了!陆续有各种新型的效果逼真的 TTS 模型发布! 就比如上周爆火的 TTS 排行榜No.1:Kokoro TTS。 而今天再为大家分享一款新型的TTS 模型:Ll
刚刚开源的新型TTS模型:Zonos!最低5s即可克隆高质量语音!
近期又发现一款刚开源的新型高保真 TTS 模型:Zonos。开源不到5天,已经在 GitHub 上收获了 1.1k 标星。 无论是快速生成特定情绪的语音,还是精准地模拟特定人的语音,它都能轻松搞定。
新型轻量级音频模型问世!1.5B参数挑战 Whisper 与 Qwen2-Audio!
随着语音助手、会议转写等应用的普及,轻量级、高性能的音频模型需求也日益增长。 Aero-1-Audio 是一款新型的1.5B参数音频模型,由 LMMs-Lab 开发,基于 Qwen-2.5-1.5B
Kimi-Audio:月之暗面开源音频大模型,1300万小时训练重塑语音交互
Kimi-Audio是月之暗面推出的开源音频基础模型,基于1300万小时多样化音频数据训练,采用混合输入架构和流式解码技术,支持语音识别、情感分析等十余种音频处理任务。