语音识别 - 用户5342984825186的收藏集 - 掘金

语音识别

用户5342984825186

更多收藏集

17篇文章 · 0订阅

语音识别技术

语音识别技术，也被称为自动语音识别Automatic Speech Recognition，(ASR)，其目标是将人类的语音中的词汇内容转换为计算机可读的输入，例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同，后者尝试识别或确认发出语音的说话人而非其中所包含的词汇…

李了个李
8年前
660
1
评论

深度学习教程 | Seq2Seq序列模型和注意力机制

本篇介绍自然语言处理中关于序列模型的高级知识，包括Sequence to sequence序列到序列模型、注意力机制等。

ShowMeAI
4年前
12k
5
评论

深度学习教程 | Seq2Seq序列模型和注意力机制

基于TensorFlow Lite的人声识别在端上的实现

通过TensorFlow Lite，移动终端、IoT设备可以在端上实现声音识别，这可以应用在安防、医疗监护等领域。来自阿里巴巴闲鱼技术互动组仝辉和上叶通过TensorFlow Lite实现了一套完整的提取声音特征，模型训练和生成端上模型方案。本文转自公众号【闲鱼技术】

闲鱼技术
7年前
2.7k
22
评论

基于TensorFlow Lite的人声识别在端上的实现

科普丨一文看懂语音识别的技术原理

简要给大家介绍一下语音怎么变文字的吧。希望这个介绍能让所有同学看懂。首先，我们知道声音实际上是一种波。常见的mp3、wmv等格式都是压缩格式，必须转成非压缩的纯波形文件来处理，比如Windows PCM文件，也就是俗称的wav文件。wav文件里存储的除了一个文件头以外，就是声…

FlyAI
8年前
2.4k
23
评论

[深度学习概念]·语音识别模型WaveNet介绍

这篇文章介绍了WaveNet，一种原始音频波形的深度生成模型。我们展示了WaveNets能够生成模仿任何人类语音的语音，并且听起来比现有的最佳文本语音系统更自然，与人类表现的差距缩小了50％以上。我们还演示了相同的网络可以用于合成其他音频信号，如音乐，并呈现自动生成的钢琴片的一些...

小宋是呢
4年前
1.9k
点赞
评论

你真的懂语音特征吗？

摘要：本文指在详细介绍语音转化声学特征的过程，并详细介绍不同声学特征在不同模型中的应用。本文分享自华为云社区《你真的懂语音特征背后的原理吗？》，作者：白马过平川。

华为云开发者联盟
4年前
1.0k
4
评论

音视频之音频知识入门

信息论的观点来看，描述信源的数据是信息和数据冗余之和，即：数据=信息+数据冗余。音频信号在时域和频域上具有相关性，也即存在数据冗余。将音频作为一个信源，音频编码的实质是减少音频中的冗余。自然界中的声音非常复杂，波形极其复杂，通常我们采用的是脉冲代码调制编码，即PCM编码。PC…

轻口味
6年前
4.2k
14
1

语音处理入门——语音的声学处理

Offer 驾到，掘友接招！我正在参与2022春招打卡活动，点击查看活动详情。语音的声学处理通常称为特征提取或者信号分析，特征是表示语音信号的一个时间片的矢量。常见的特征类型有LPC（线性

安余生大大
4年前
902
1
评论

聊聊机器如何理解人类的语言

自然语言对于人类发展进程是至关重要的，可以说如果没有自然语言就不会有人类的文明，它也是人类独有的能力。想象一下，如果没有自然语言我们该如何进行思想交流，该如何进行人与人之间的协作？。人类的自然语言发展到如今已经是高度成熟了，同时这也是一个相当复杂的系统，从字到单词到短语再到句…

超人汪小建
5年前
4.1k
5
1

浅谈语音识别基础

这篇文章主要讲了语音识别领域里面的两种经典模型 GMM-HMM 和 CD-DNN-HMM，还介绍了一些相关的内容，比如自适应技术、序列鉴别性训练、表征学习。

NicholasYu
9年前
2.5k
24
1