Normalized Gaussian Wasserstein Distance
由于小物体的边界框可能包含许多背景信息,框内每点的重要程度不同,因此可以考虑用高斯分布来建模边界框,直觉上,我们可以采用边界框的内接椭圆来形成一个高斯分布表示。
那么有了预测框(xa,ya,wa,ha)和真实框(xb,yb,wb,hb)对应的两个高斯分布 Na,Nb,如何评判他们的相似度,从而计算损失呢?
这里引入 Wasserstein 距离,该距离可以用来衡量两个分布的相似程度, Na,Nb 的二阶 Wasserstein 距离为
W22(Na,Nb)=∥([xa,ya,2wa,2ha]T,[xb,yb,2wb,2hb]T)∥22
归一化
NWD(Na,Nb)=exp(−CW22(Na,Nb))
损失
LNWD=1−NWD(Na,Nb)
Additive Angular Margin Loss
softmax 损失函数:
Lsoftmax=−logΣj=1NeWjTxi+bjeWyiTxi+byi
其中 xi 表示第 i 个样本的特征向量,属于第 yi 类。Wj 表示权重矩阵的第 j 列,N 是总类别数
令偏置为 0 ,WjTxi 写成 ∥Wj∥∥xi∥cosθj 的形式,使得 Wj 的 L2 范数为 1,xi 的 L2 范数为 s,则上式可写为
Lsoftmaxθ=−logescosθyi+Σj=1,j=yiNescosθjescosθyi
通过在 Wj 和 xi 之间施加 additive angular margin penalty,即可达到增加类间距,缩小类内距的效果
LArcFace=−logescos(θyi+m)+Σj=1,j=yiNescosθjescos(θyi+m)