mojin's pytorch progress

2023-10-18 81 阅读2分钟

图像分类任务介绍

常见的是数据驱动的图像分类范式，分为三个步骤。

1.数据集构建（有监督和无监督）

2.分类器设计与学习

图像表示：输入的图像能够被算法所接受分类模型：给我一张图像，能够对图像进行预测。将预测值和真实值进行比较（损失函数）损失值反映了当前模型性能好坏，如果不好，靠优化算法更新模型参数。
流程图如下：

3.分类器决策

训练过程分为数据集划分，数据预处理，数据增强。
数据增强的目标是使得数据量变多。超参数调整是模型设计中做的工作。什么是模型设计呢，就是神经元个数，怎么去设计?
模型集成：就是用多个模型

Top1指标就是第一个是对的就是对的
Top5指标是五个中有一个是对的就是对的

图像类型分为二进制图，灰度图，和彩色图像。

有多少个类就有多少个w和多少个b
w是10*3072

cat和car是错误的，所以损失是Sij

2.L=类别数-1如果w和b为0，总损失不是类别数-1说明编码有问题

1epoch = 总样本数/批量m

P23损失函数与反向传播

引入损失函数

目标分数targets
实际分数output

LOSS是衡量实际值和预期值的差距。 Loss = (30-10)+(20-10)+(50-10)=70 LOSS的作用是为我们更新输出，使得输出更加接近预期值。为我们更新输出提供一定的依据。（反向传播）交叉熵损失

3.

P24优化器 P28完整的模型训练套路

两个输入
[0.1,0.2]
[0.3,0.4]
在0类别概率为0.1，在1类别概率为0.2
preds为预测，第一个输入在1类别概率大一些，所以preds=[1]
第二个输入在1类别概率大一些，所以preds=[1]

以上这些是人工算出来的，机器怎么转换呢？
用到的就是argmax