语音识别 - macbeth的收藏集 - 掘金

语音识别

更多收藏集

5篇文章 · 0订阅

CosyVoice:阿里最强语音克隆模型体验并封装API接口

在中文TTS技术上，最近一年涌现出众多优秀方案，如GPT-SoVITS、ChatTTS和Fish TTS等，阿里新推出的CosyVoice，效果最佳。

mortimer
1年前
7.7k
21
9

CosyVoice:阿里最强语音克隆模型体验并封装API接口

【语音识别】从入门到精通——最全干货大合集！

Context-Dependent Pre-Trained Deep Neural Networks for Large-Vocabulary Speech Recognition(2012), George E. Dahl et al. https://ieeexplore.…

Mr_zebra
7年前
1.5k
1
评论

纯PyTorch语音工具包SpeechBrain开源，Kaldi：我压力有点大

机器之心报道，编辑：蛋酱。语音处理技术的进步，是人工智能改变大众的生活的重要一环。深度学习技术的兴起，也让这一领域近年来得到了长足的发展。在过往，该领域的主要方法是为不同的任务开发不同的工具包，对于使

机器之心
4年前
1.6k
9
评论

基于阿里Paraformer模型打造中文语音识别

openai-whisper是流行的语音识别解决方案，支持数十种语言，对中文支持效果也不错，不过在使用低于large尺寸的模型时，效果仍是略差。相比而言，国内阿里系专注于中文识别的模型效果就好了不少。

mortimer
1年前
2.2k
2
4

基于阿里Paraformer模型打造中文语音识别

阿里云Funasr语音识别大模型本地部署，效果远超OpenAI的Whisper

前言前段时间测试一下OpenAI的语音识别模型当时发现效率很低，今天发现阿里有一个专注的语音识别大模型FunAsr 看介绍Funasr的中文识别能力应该比Whisper更强大： Funasr的模型

土圭垚墝
1年前
8.0k
16
3

阿里云Funasr语音识别大模型本地部署，效果远超OpenAI的Whisper