问题背景
在机器学习和深度学习中,一般都会要求有足够的的样本数量。样本数量足够多的时候,训练出来的模型效果就越好,模型的泛化能力越强。一般做目标检测项目,至少会要求每种检测目标包含1000张以上的图片。但是在实际项目中,样本数量不足,或者拍摄的质量没有达到算法要求,同时,如果部分情况下没有可参考的预训练模型和参数,不能使用迁移学习。这时候就需要对样本进行数据增强,以提高样本的质量。
图片增强方法
在数据预处理中,常见的图片增强方法如下:
1.对图像进行一定比例的缩放
2.对图像进行随机位置的截取
3.对图像进行随机的水平和垂直翻转
4.对图像进行随机角度的旋转
5.对图像进行亮度、对比度和颜色的随机变化
对图像进行各种操作,可以生成数倍于原始图像的增强图像集。这些数据集可以帮我们有效的数据不够,模型过拟合的问题,增加了算法的泛化能力,更好的生成理想的模型。