语音转文字 - 用户208319915637的收藏集 - 掘金

语音转文字

用户208319915637

更多收藏集

19篇文章 · 0订阅

语音对话项目进阶，接入百度语音技术

AI语音聊天语音识别语音合成百度接口 vue3 node.js langchain.js zhipuAI

小识谭记
1年前
1.4k
11
3

语音对话项目进阶，接入百度语音技术

「 volute 」树莓派+Node.js造一个有灵魂的语音助手

树莓派（英语：Raspberry Pi）是基于 Linux 的单片机电脑，由英国树莓派基金会开发，目的是以低价硬件及自由软件促进学校的基本计算机科学教育。树莓派每一代均使用博通（Broadcom）出产的 ARM 架构处理器，如今生产的机型内存在 2GB 和 8GB 之间，主要…

null仔
5年前
13k
220
48

「 volute 」树莓派+Node.js造一个有灵魂的语音助手

社会适老化建设，从一个 LLM 应用开始

我们都在畅想 AI 掀起的变革，但也很容易因此忽略热潮之外的群体。技术可以在高空中绽放出绚烂夺目的光芒，也同样可以在细微处散发温热，暖人心窝。作为驾驭技术的人，我们开发者的目光要投向哪里，这至关重要。

寨可是Jax
1年前
575
15
评论

中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽

君不言语音识别技术则已，言则必称Whisper，没错，OpenAi开源的Whisper确实是世界主流语音识别技术的魁首，但在中文领域，有一个足以和Whisper相颉顽的项目，那就是阿里达摩院自研的

刘悦的技术博客
2年前
6.2k
20
10

中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽

开源ASR服务器vosk

本文已参与「新人创作礼」活动，一起开启掘金创作之路。概述近几年由于AI的迅速发展，语音相关的自然语言处理NLP项目也变多了，新的技术也越来越成熟，其中TTS（语音生成）和ASR（语音识别）是NLP

ai技术WX_3307623172
4年前
989
点赞
评论

语音识别(ASR)系列之二：混合模型

本文已参与「新人创作礼」活动，一起开启掘金创作之路。上篇系列之一从总体上讲了ASR的原理、评估方法、模型发展，这一篇开始介绍称霸ASR三十年的混合模型(Hybrid Model)，特别是GMM/HM

ai技术WX_3307623172
4年前
384
点赞
评论

语音识别（ASR）--语音转文字

一起养成写作习惯！这是我参与「掘金日新计划 · 4 月更文挑战」的第15天语音识别的基本原理语音识别系统本质上是一种模式识别系统，包括特征提取、模式匹配、参考模式库等三个基本单元，它的基本结构如下

ai技术WX_3307623172
4年前
791
1
评论

语音识别(ASR)系列之三：CTC、RNN-T模型

本文已参与「新人创作礼」活动，一起开启掘金创作之路。上一篇系列之二介绍了早期的混合模型，底层使用GMM或者DNN计算帧对应的音素概率，上层使用HMM寻找最优的音素序列，得到最终的文字序列。该模型的缺

ai技术WX_3307623172
4年前
743
点赞
评论

初探语音识别ASR算法

摘要：语音转写文字ASR技术的基本概念与数学原理简介。本文分享自华为云社区《新手语音入门（三）：语音识别ASR算法初探 | 编码与解码 | 声学模型与语音模型 | 贝叶斯公式 | 音素》，作者：

华为云开发者联盟
4年前
3.9k
3
1

阿里达摩院开源大型端到端语音识别工具包FunASR | 弥合学术与工业应用之间的差距

本文介绍了一个开源语音识别工具包FunASR，旨在弥合学术研究和工业应用之间的差距。FunASR提供了在大规模工业语料库上训练的模型，并能够将其部署到应用程序中。

CVHub
2年前
2.4k
1
评论