深度学习是如何用于数据科学任务的

322 阅读3分钟

在这篇文章中,我们将看到深度学习是如何在数据科学中使用的。

目录

  • 什么是深度学习?

  • 深度学习的用途

什么是深度学习?

深度学习是机器学习的一个子集。它主要围绕着人工神经网络,其灵感来自于人脑的结构和功能。与机器学习不同,深度学习消除了数据预处理,能够处理图像等非结构化数据,并自动提取必要的特征,从而减少机器对人类的依赖性。下面的图片显示了机器学习和深度学习之间的区别。
ML-vs-DL-min

深度学习的用途

由于机器学习是数据科学的一个组成部分,这实质上使深度学习也成为数据科学的一个重要组成部分。在大数据分析领域,深度学习可用于从海量数据中提取复杂的模式、数据标签、快速检索信息和其他各种任务。通过分层的学习过程,深度学习算法能够提取复杂的抽象概念作为数据表示。有了从这些复杂的数据表征中获得的知识,简单的线性模型工作起来更加高效。

在现实世界中,深度学习被用于图像分割、分析和视觉识别。深度学习算法可以根据图片中检测到的位置和人脸,按照日期或事件进行分类。
deep-learning

它被用来对灰度图像进行着色,还可以为无声视频添加适当的配音。
bw_colorization_opencv_arch

2018年温布尔登网球赛甚至利用深度学习来生成亮点。他们使用IBM Watson来分析球员的情绪,然后利用深度学习来考虑比赛的受欢迎程度、球员的受欢迎程度和观众的反应,以自动生成亮点。

长短时记忆递归神经网络用于语音到文本的转换,是虚拟助手的重要组成部分。使用RNN是为了让虚拟助手能够抓住语言上的细微差别,并框定正确的反应。它们评估人类语言,并从中学习,以执行所给的命令。下面是一个例子,说明如何使用递归神经网络识别语音命令。
LSTM-for-speech-command-recognition

深度学习也可用于语义索引,以便有效地存储大量的数据。它使得从高维数据中获得语义特征成为可能,从而减少了复杂数据表示的维度。它还可以用于文档总结。下面的图片显示了如何使用能够对多个标签进行分类的深度水平学习来进行语义索引。
Semantic-indexing-1

数据科学和深度学习齐头并进的一个应用是自动驾驶汽车。来自摄像头、传感器、地理测绘的数百万实时数据被不断输入,并使用深度学习算法进行建模,以根据车辆的环境做出决定,如在交通中导航、路障、识别路线和挂出的标志(禁止停车、禁止鸣笛、学校区域)。