Deep Learning 深度学习 DAY1数据每个数据集由一个个样本（example, sample）组成模型

数据

每个数据集由一个个样本（example, sample）组成

模型

相当于一个function

目标函数

在机器学习中，我们需要定义模型的优劣程度的度量，这个度量在大多数情况是“可优化”的，这被称之为目标函数（objective function）。我们通常定义一个目标函数，并希望优化它到最低点。因为越低越好，所以这些函数有时被称为损失函数（loss function，或cost function）。

优化算法

当我们获得了一些数据源及其表示、一个模型和一个合适的损失函数，接下来就需要一种算法，它能够搜索出最佳参数，以最小化损失函数。深度学习中，大多流行的优化算法通常基于一种基本方法–梯度下降（gradient descent）。

update vs eproh (1 eproh = see all the batches once)

better on training data,worse on unseen data ==> overfitting

prefer smooth function,but don't be too smooth

监督学习（supervised learning）擅长在“给定输入特征”的情况下预测标签。每个“特征-标签”对都称为一个样本（example）。

1.1 回归（regression）

Regression

stock market forcast

f( ) = dow jones tomorrow

step1:model

step2:goodness of function

step3:gradient descent

1.2 分类（classification）

虽然回归模型可以很好地解决“有多少”的问题，但是很多问题并非如此。例如，一家银行希望在其移动应用程序中添加支票扫描功能。具体地说，这款应用程序能够自动理解从图像中看到的文本，并将手写字符映射到对应的已知字符之上。这种“哪一个”的问题叫做分类（classification）问题。分类问题希望模型能够预测样本属于哪个类别（category，正式称为类（class））。

Classification 1-D gaussian

step1:function set(model)

step2:goodness of function

step3:find the best function:easy

1.3 搜索

在信息检索领域，我们希望对一组项目进行排序。以网络搜索为例，目标不是简单的“查询（query）-网页（page）”分类，而是在海量搜索结果中找到用户最需要的那部分。

1.4 推荐系统（recommender system）

它的目标是向特定用户进行“个性化”推荐。例如，对于电影推荐，科幻迷和喜剧爱好者的推荐结果页面可能会有很大不同。

1.5 序列学习

序列学习需要摄取输入序列或预测输出序列，或两者兼而有之。

如果工作没有十分具体的目标，就需要“自发”地去学习了。比如，老板可能会给我们一大堆数据，然后要求用它做一些数据科学研究，却没有对结果有要求。这类数据中不含有“目标”的机器学习问题通常被为无监督学习（unsupervised learning）