图像增广(image augmentation)是通过对训练图像进行一系列随机改变,从而产生相似但又不同的训练样本的技术。
图像增广有以下两个主要作用:
例如,通过不同方式裁剪图像,使感兴趣的物体出现在不同位置,可以减轻模型对物体出现位置的依赖性;调整亮度、色彩等因素能降低模型对色彩的敏感度。
一些常见的图像增广方法包括:
torchvision.transforms.RandomHorizontalFlip
或tf.image.random_flip_left_right
实现)和上下翻转(通过torchvision.transforms.RandomVerticalFlip
或tf.image.random_flip_up_down
实现),通常不会改变对象的类别。torchvision.transforms.RandomResizedCrop
或tf.image.random_crop
。torchvision.transforms.ColorJitter
中的brightness
参数或tf.image.random_brightness
实现。torchvision.transforms.ColorJitter
中的hue
参数或tf.image.random_hue
。torchvision.transforms.ColorJitter
实例并设置相应参数即可。torchvision.transforms.Compose
将多个图像增广方法组合起来应用到图像上。在实践中,通常仅在训练样本上进行图像增广,而在预测过程中不使用随机操作的图像增广,以获得确切的结果。
上一篇:目标检测IOU和NMS详解
下一篇:mysql-造数据/列转行