首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
语音转文字
订阅
用户208319915637
更多收藏集
微信扫码分享
微信
新浪微博
QQ
19篇文章 · 0订阅
语音对话项目进阶,接入百度语音技术
AI语音聊天 语音识别 语音合成 百度接口 vue3 node.js langchain.js zhipuAI
「 volute 」树莓派+Node.js造一个有灵魂的语音助手
树莓派(英语:Raspberry Pi)是基于 Linux 的单片机电脑,由英国树莓派基金会开发,目的是以低价硬件及自由软件促进学校的基本计算机科学教育。 树莓派每一代均使用博通(Broadcom)出产的 ARM 架构处理器,如今生产的机型内存在 2GB 和 8GB 之间,主要…
社会适老化建设,从一个 LLM 应用开始
我们都在畅想 AI 掀起的变革,但也很容易因此忽略热潮之外的群体。技术可以在高空中绽放出绚烂夺目的光芒,也同样可以在细微处散发温热,暖人心窝。作为驾驭技术的人,我们开发者的目光要投向哪里,这至关重要。
中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽
君不言语音识别技术则已,言则必称Whisper,没错,OpenAi开源的Whisper确实是世界主流语音识别技术的魁首,但在中文领域,有一个足以和Whisper相颉顽的项目,那就是阿里达摩院自研的
开源ASR服务器vosk
本文已参与「新人创作礼」活动,一起开启掘金创作之路。 概述 近几年由于AI的迅速发展,语音相关的自然语言处理NLP项目也变多了,新的技术也越来越成熟,其中TTS(语音生成)和ASR(语音识别)是NLP
语音识别(ASR)系列之二:混合模型
本文已参与「新人创作礼」活动,一起开启掘金创作之路。 上篇系列之一从总体上讲了ASR的原理、评估方法、模型发展,这一篇开始介绍称霸ASR三十年的混合模型(Hybrid Model),特别是GMM/HM
语音识别(ASR)--语音转文字
一起养成写作习惯!这是我参与「掘金日新计划 · 4 月更文挑战」的第15天 语音识别的基本原理 语音识别系统本质上是一种模式识别系统,包括特征提取、模式匹配、参考模式库等三个基本单元,它的基本结构如下
语音识别(ASR)系列之三:CTC、RNN-T模型
本文已参与「新人创作礼」活动,一起开启掘金创作之路。 上一篇系列之二介绍了早期的混合模型,底层使用GMM或者DNN计算帧对应的音素概率,上层使用HMM寻找最优的音素序列,得到最终的文字序列。该模型的缺
初探语音识别ASR算法
摘要:语音转写文字ASR技术的基本概念与数学原理简介。 本文分享自华为云社区《新手语音入门(三): 语音识别ASR算法初探 | 编码与解码 | 声学模型与语音模型 | 贝叶斯公式 | 音素》,作者:
阿里达摩院开源大型端到端语音识别工具包FunASR | 弥合学术与工业应用之间的差距
本文介绍了一个开源语音识别工具包FunASR,旨在弥合学术研究和工业应用之间的差距。FunASR提供了在大规模工业语料库上训练的模型,并能够将其部署到应用程序中。