首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
语音识别
订阅
macbeth
更多收藏集
微信扫码分享
微信
新浪微博
QQ
5篇文章 · 0订阅
CosyVoice:阿里最强语音克隆模型体验并封装API接口
在中文TTS技术上,最近一年涌现出众多优秀方案,如GPT-SoVITS、ChatTTS和Fish TTS等,阿里新推出的CosyVoice,效果最佳。
【语音识别】从入门到精通——最全干货大合集!
Context-Dependent Pre-Trained Deep Neural Networks for Large-Vocabulary Speech Recognition(2012), George E. Dahl et al. https://ieeexplore.…
纯PyTorch语音工具包SpeechBrain开源,Kaldi:我压力有点大
机器之心报道,编辑:蛋酱。语音处理技术的进步,是人工智能改变大众的生活的重要一环。深度学习技术的兴起,也让这一领域近年来得到了长足的发展。在过往,该领域的主要方法是为不同的任务开发不同的工具包,对于使
基于阿里Paraformer模型打造中文语音识别
openai-whisper是流行的语音识别解决方案,支持数十种语言,对中文支持效果也不错,不过在使用低于large尺寸的模型时,效果仍是略差。相比而言,国内阿里系专注于中文识别的模型效果就好了不少。
阿里云Funasr语音识别大模型本地部署,效果远超OpenAI的Whisper
前言 前段时间测试一下OpenAI的语音识别模型 当时发现效率很低,今天发现阿里有一个专注的语音识别大模型FunAsr 看介绍Funasr的中文识别能力应该比Whisper更强大: Funasr的模型