携手创作，共同成长！这是我参与「掘金日新计划 · 8 月更文挑战」的第1天，点击查看活动详情

深度学习的发展建立在统计学习的高度繁荣之上，得益于不断发展的互联网技术积累了大量的数据资源，以及更为普及的高性能计算硬件。有别于统计学习依赖于专家知识来确定特征的限制，深度学习模型可以自动地在数据中学习特征表示，从而能够对海量数据进行处理，在一定程度上实现端到端的机器学习系统。典型的深度学习模型就是很深层的神经网络。

基本的神经网络模型（浅层结构） 可被归纳为一种特殊的统计学习方法。不同于支持向量机采用核映射转化问题，神经网络结构直接采用非线性映射（激活函数）的形式拟合数据分布规律。神经网络是深度学习的起源，后者是对采用深度神经网络完成机器学习任务的各种机器学习方法的概括。近年来，深度学习方法已成为推动人工智能技术的主要力量。

多隐层神经网络难以直接用经典算法 ( 例如标准 EP 算法 ) 进行训练，因为误差在多隐层内逆传播时，往往会发散 (diverge) 而不能收敛到稳定状态。

常见的深度神经网络模型有卷积神经网络（ Convolutional neural networks, CNN ）、循环神经网络（Recurrent neural networks, RNN ）、 深度信念网络（Deep belief networks, DBN ）等。

我们可以这样理解深度学习：多层堆叠、每层对上一层的输出进行处理的机制，可看作是在对输入信号进行逐层加工，从而把初始的、与输出目标之间联系不太密切的输入表示，转化成与输出目标联系更密切的表示，使得原来仅基于最后一层输岀映射难以完成的任务成为可能。换言之，通过多层处理，逐渐将初始的“低层”特征表示转化为“高层”特征表示后，用“简单模型”即可完成复杂的分类等学习任务。由此可将深度学习理解为进行 “特征学习” (Feature learning) 或 “表示学习 ****” (R epresentation learning) 。很多研究者认为深度学习本质也是在做归纳偏好学习（ Inductive Bias Learning ）。以往在机器学习用于现实任务时，描述样本的特征通常需由人类专家来设计，这称为 “特征工程” (feature engineering) 。特征学习则通过机器学习技术自身来产生好特征，这使机器学习向“全自动数据分析”又前进了—步。

一个学习算法（ learning algorithm ）其实是一个灵活的元程序，输出由许多参数（ parameter ）决定，通过数据集来选择参数。可把参数看作是旋钮，我们可以转动旋钮来调整程序的行为。任一调整参数后的程序，我们称为模型（ model ）。通过操作参数而生成的所有不同程序（输入-输出映射）的集合称为“模型族”。在机器学习中，学习（ learning ）是一个训练模型的过程。通过这个过程，我们可以发现正确的参数集，从而使模型强制执行所需的行为。换句话说，我们用数据训练（ train ）我们的模型。每一个模型都是在转换数据，是一个函数，一个输入与输出的映射关系。

可以将机器学习算法统一理解为压缩算法（扔信息是肯定的），将大量原始信息压缩到少数人能理解的语义信息。

简要介绍什么是深度学习

推荐学习资料

吴恩达·深度学习deeplearning.ai

李沐·动手学深度学习