计算机视觉8 图像增广
创始人
2024-12-28 13:35:02
0

图像增广(image augmentation)是通过对训练图像进行一系列随机改变,从而产生相似但又不同的训练样本的技术。

图像增广有以下两个主要作用:

  1. 扩大训练数据集的规模;
  2. 随机改变训练样本可以降低模型对某些属性的依赖,从而提高模型的泛化能力。

例如,通过不同方式裁剪图像,使感兴趣的物体出现在不同位置,可以减轻模型对物体出现位置的依赖性;调整亮度、色彩等因素能降低模型对色彩的敏感度。

一些常见的图像增广方法包括:

  1. 翻转:如左右翻转(通过torchvision.transforms.RandomHorizontalFliptf.image.random_flip_left_right实现)和上下翻转(通过torchvision.transforms.RandomVerticalFliptf.image.random_flip_up_down实现),通常不会改变对象的类别。
  2. 随机裁剪:随机裁剪一个面积为原始面积一定比例(如10%到100%)的区域,该区域的宽高比也在一定范围内随机取值(如0.5到2),然后将该区域的宽度和高度缩放到指定像素(如200像素)。例如,使用torchvision.transforms.RandomResizedCroptf.image.random_crop
  3. 亮度变化:将图像的亮度随机调整为原图亮度的一定比例范围(如50%到150%),可通过torchvision.transforms.ColorJitter中的brightness参数或tf.image.random_brightness实现。
  4. 色调变化:随机更改图像的色调,如使用torchvision.transforms.ColorJitter中的hue参数或tf.image.random_hue
  5. 颜色变化:还可以同时随机更改图像的亮度、对比度、饱和度和色调,创建torchvision.transforms.ColorJitter实例并设置相应参数即可。
  6. 组合多种方法:可以使用torchvision.transforms.Compose将多个图像增广方法组合起来应用到图像上。

在实践中,通常仅在训练样本上进行图像增广,而在预测过程中不使用随机操作的图像增广,以获得确切的结果。

相关内容

热门资讯

四分钟经验!微信小程序破解内购... 四分钟经验!微信小程序破解内购,新西游辅助器(辅助)确实是有脚本(哔哩哔哩)1)微信小程序破解内购免...
第一分钟手册!欢乐达人透视脚本... 第一分钟手册!欢乐达人透视脚本,超级三加一辅助软件(辅助)一直真的有app(哔哩哔哩)1、许多玩家不...
第7分钟策略!杭州都莱辅助软件... 第7分钟策略!杭州都莱辅助软件有没有用,方片十三张外卦(辅助)一直存在有app(哔哩哔哩)1、完成杭...
九分钟练习!约局八辅助器,海螺... 九分钟练习!约局八辅助器,海螺众娱辅助(辅助)原来真的是有辅助器(哔哩哔哩)约局八辅助器透视方法中分...
四分钟绝活!微信小程序边锋干橙... 四分钟绝活!微信小程序边锋干橙眼辅助,超级三加一正版(辅助)果然存在有app(哔哩哔哩)1、操作简单...
第九分钟课程!微信卡农辅助,新... 第九分钟课程!微信卡农辅助,新九游辅助器软件激活码(辅助)果然真的是有软件(哔哩哔哩)一、新九游辅助...
两分钟手筋!新道游科技透视收费... 两分钟手筋!新道游科技透视收费,财神十三张脚本效果图(辅助)一贯有挂下载(哔哩哔哩)1、不需要AI权...
七分钟法子!情怀游戏辅助器,九... 七分钟法子!情怀游戏辅助器,九游破解辅助插件教程(辅助)一贯是有辅助器(哔哩哔哩);1、七分钟法子!...
2分钟总结!杭州都莱挂,九游破... 2分钟总结!杭州都莱挂,九游破解版真的假的(辅助)切实真的是有插件(哔哩哔哩)1、九游破解版真的假的...
四分钟诀窍!四川麻将血战如何开... 四分钟诀窍!四川麻将血战如何开挂辅助,财神十三章安装包(辅助)真是真的是有app(哔哩哔哩)1、这是...