首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
语音识别
订阅
用户5342984825186
更多收藏集
微信扫码分享
微信
新浪微博
QQ
17篇文章 · 0订阅
语音识别技术
语音识别技术,也被称为自动语音识别Automatic Speech Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇…
深度学习教程 | Seq2Seq序列模型和注意力机制
本篇介绍自然语言处理中关于序列模型的高级知识,包括Sequence to sequence序列到序列模型、注意力机制等。
基于TensorFlow Lite的人声识别在端上的实现
通过TensorFlow Lite,移动终端、IoT设备可以在端上实现声音识别,这可以应用在安防、医疗监护等领域。来自阿里巴巴闲鱼技术互动组仝辉和上叶通过TensorFlow Lite实现了一套完整的提取声音特征,模型训练和生成端上模型方案。 本文转自公众号【闲鱼技术】
科普丨一文看懂语音识别的技术原理
简要给大家介绍一下语音怎么变文字的吧。希望这个介绍能让所有同学看懂。 首先,我们知道声音实际上是一种波。常见的mp3、wmv等格式都是压缩格式,必须转成非压缩的纯波形文件来处理,比如Windows PCM文件,也就是俗称的wav文件。wav文件里存储的除了一个文件头以外,就是声…
[深度学习概念]·语音识别模型WaveNet介绍
这篇文章介绍了WaveNet,一种原始音频波形的深度生成模型。我们展示了WaveNets能够生成模仿任何人类语音的语音,并且听起来比现有的最佳文本语音系统更自然,与人类表现的差距缩小了50%以上。我们还演示了相同的网络可以用于合成其他音频信号,如音乐,并呈现自动生成的钢琴片的一些...
你真的懂语音特征吗?
摘要:本文指在详细介绍语音转化声学特征的过程,并详细介绍不同声学特征在不同模型中的应用。本文分享自华为云社区《你真的懂语音特征背后的原理吗?》,作者: 白马过平川 。
音视频之音频知识入门
信息论的观点来看,描述信源的数据是信息和数据冗余之和,即:数据=信息+数据冗余。音频信号在时域和频域上具有相关性,也即存在数据冗余。将音频作为一个信源,音频编码的实质是减少音频中的冗余。 自然界中的声音非常复杂,波形极其复杂,通常我们采用的是脉冲代码调制编码,即PCM编码。PC…
语音处理入门——语音的声学处理
Offer 驾到,掘友接招!我正在参与2022春招打卡活动,点击查看活动详情。 语音的声学处理通常称为特征提取或者信号分析,特征是表示语音信号的一个时间片的矢量。常见的特征类型有LPC(线性
聊聊机器如何理解人类的语言
自然语言对于人类发展进程是至关重要的,可以说如果没有自然语言就不会有人类的文明,它也是人类独有的能力。想象一下,如果没有自然语言我们该如何进行思想交流,该如何进行人与人之间的协作?。 人类的自然语言发展到如今已经是高度成熟了,同时这也是一个相当复杂的系统,从字到单词到短语再到句…
浅谈语音识别基础
这篇文章主要讲了语音识别领域里面的两种经典模型 GMM-HMM 和 CD-DNN-HMM,还介绍了一些相关的内容,比如自适应技术、序列鉴别性训练、表征学习。