图像分类任务介绍
常见的是数据驱动的图像分类范式,分为三个步骤。
1.数据集构建 (有监督和无监督)
2.分类器设计与学习
图像表示:输入的图像能够被算法所接受
分类模型:给我一张图像,能够对图像进行预测。
将预测值和真实值进行比较(损失函数)
损失值反映了当前模型性能好坏,如果不好,靠优化算法更新模型参数。
流程图如下:
3.分类器决策
训练过程分为数据集划分,数据预处理,数据增强。
数据增强的目标是使得数据量变多。
超参数调整是模型设计中做的工作。什么是模型设计呢,就是神经元个数,怎么去设计?
模型集成:就是用多个模型
Top1指标就是第一个是对的就是对的
Top5指标是五个中有一个是对的就是对的
图像类型分为二进制图,灰度图,和彩色图像。
有多少个类就有多少个w和多少个b
w是10*3072
cat和car是错误的,所以损失是Sij
2.L=类别数-1如果w和b为0,总损失不是类别数-1说明编码有问题
1epoch = 总样本数/批量m
P23损失函数与反向传播
-
引入损失函数
目标分数targets
实际分数output
LOSS是衡量实际值和预期值的差距。
Loss = (30-10)+(20-10)+(50-10)=70
LOSS的作用是为我们更新输出,使得输出更加接近预期值。为我们更新输出提供一定的依据。(反向传播)
交叉熵损失
3.
P24优化器 P28完整的模型训练套路
两个输入
[0.1,0.2]
[0.3,0.4]
在0类别概率为0.1,在1类别概率为0.2
preds为预测,第一个输入在1类别概率大一些,所以preds=[1]
第二个输入在1类别概率大一些,所以preds=[1]
以上这些是人工算出来的,机器怎么转换呢?
用到的就是argmax