样本不均衡的解决办法1、使用focal loss focal loss主要是针对不同label进行加权，同时更加关注于h

1、使用focal loss focal loss主要是针对不同label进行加权，同时更加关注于hard sample。

首先在原有的基础上加了一个因子，其中gamma>0使得减少易分类样本的损失。使得更关注于困难的、错分的样本。

例如gamma为2，对于正类样本而言，预测结果为0.95肯定是简单样本，所以（1-0.95）的gamma次方就会很小，这时损失函数值就变得更小。而预测概率为0.3的样本其损失相对很大。对于负类样本而言同样，预测0.1的结果应当远比预测0.7的样本损失值要小得多。对于预测概率为0.5时，损失只减少了0.25倍，所以更加关注于这种难以区分的样本。这样减少了简单样本的影响，大量预测概率很小的样本叠加起来后的效应才可能比较有效。

此外，加入平衡因子alpha，用来平衡正负样本本身的比例不均：文中alpha取0.25，即正样本要比负样本占比小，这是因为负例易分。

2、上采样、下采样

上采样的思想是针对少数类样本进行数据增强（每个方向都有自己数据增强的方法就不一一介绍了），这里简单介绍下smote方法，

下采样的思想是针对多数类样本进行降采样，可以采用随机删除等一些方式