神经网络——计算机视觉

（一）基础知识

线性得分函数：
$f( x , W) = Wx + b$

f ：每个类别的得分（类别 * 1）
W：权重参数（类别 * 像素点）
x：图片（像素点 * 1）
b：偏置参数（类别 * 1）

损失函数：
1、损失函数 = 数据损失 + 正则化惩罚
$L_i=\sum_{j≠{y_i}}max(0,f( x , W)_j-f( x , W)_{y_i}+1)$

$L_i$ ：数据损失值
$f( x , W)_{y_i}$ ：正确类别的得分
$f( x , W)_j+1$ ：其他类别的得分+误差

$R(W)=λ\sum_kW_k^2$

$R(W)$ ：正则惩罚项
λ：不希望过拟合λ取大

2、Softmax分类器：将得分转化为概率
归一化： $P(Y=k|X=x_i)=\frac {e^{s_k}} {\sum_je^{s_j}}$

$s_k$ ：k类别的得分函数

计算损失值： $L_i=-logP(Y=y_i|X=x_i)$

$f(x,W)=((x*W_1(x))*W_2(x))*W_3(x)$

从 $W_3$ 到 $W_1$ 逐层求偏导计算梯度判断对f的影响

整体结构.jpg

input layer：输入特征矩阵
hidden layer1：特征矩阵 * 权重矩阵1
hidden layer2：hidden layer1 * 权重矩阵2
output layer：输出hidden layer2 * 权重矩阵3
非线性：每一步矩阵计算后进行非线性变换（激活函数）

激活函数：

数据预处理：

参数初始化：
权重矩阵：W = 0.01* np.random.ramdn(D,H)

防止过拟合的方法：
DROP-OUT：在训练过程中，每层只有固定比例的神经元参与训练，依次替换。

cnn整体架构.jpg

卷积的作用：分出不同的小区域，选择一种方法去多通道计算对应小区域应该的特征值
输入层：输入各个通道的像素点信息，深度为通道数
卷积层：将各个通道的小区域卷积计算（与卷积核内积）后相加，再加偏秩项
池化层：通过某种筛选方法，将特征图的各个区域压缩
全连接层：将特征向量转化成各类别的概率值

卷积核：将卷积参数共享，大幅度降低权重参数（（卷积核大小 + 1） * 个数）。
参数：活动窗口步长小，特征丰富；卷积核尺寸小，所需参数小，卷积过程多，
特征提取更细致，加入的非线性变换多，还不会增大权重参数。
边界填充：填充后，让原来的边界值也可以充分的利用。
特征图：卷积层得出的结果，深度为卷积核F的个数，P表示边界填充了几圈。
长度 $H_2=\frac{H_1-F_H+2P}{S}+1$
宽度 $W_2=\frac{W_1-F_W+2P}{S}+1$