
分类任务:输入一个东西,识别出这个东西的所属类别。Location相当于定位,比如定位图像当中所有的物体。

分类+回归:即知道这个猫还要将猫定位出来。

Location输出的是坐标值。

给定真实值:类别和位置。那么预测值和真实值之间会有个差异,让预测值的框不断的去拟合真实值框之间的差距。回归就是一个不断拟合的操作。

弄两个全连接层,其中一个用softmax来计算损失(分类),另一个用欧氏距离来计算损失(回归)

第一步下载模型,即定义模型的结构。TensorFlow和caffe都可以在各自的GitHub社区找到想要的模型来初始化自己的模型参数。

将全连接层改成自己需要的结构。

通过滑动窗口来做分类和回归

ResNet残差网络(100多层),现在残差网络使用是比较多的。