当前位置：首页 > news >正文

【ML】Image Augmentation）的作用、使用方法及其分类

news 来源：原创 2024/9/20 22:34:40

图像增强（Image Augmentation）的作用、使用方法及其分类

- - 1. 图像增强的定义
  - 2. 图像增强的作用
  - 3. 什么时候使用图像增强？
  - 4. 图像增强详细方法分类梳理
  - 4.1 图像增强方法列表
  - 4.2 边界框增强方法
  - 5. 参考资料

yolov3（一：模型训练）
yolov3（二：车牌识别）
yolov3（四：车牌识别及算法解析）

1. 图像增强的定义

图像增强（Image Augmentation）是一种技术，它通过对原始图像进行各种变换或操作，生成新的图像数据。这些变换包括旋转、翻转、裁剪、调节亮度、添加噪声等。图像增强主要用于扩充训练数据集，以提高机器学习模型的鲁棒性和泛化能力。

2. 图像增强的作用

扩充数据集：在数据有限的情况下，图像增强可以人为增加数据量，生成更多的训练样本，从而避免模型过拟合。
提高模型鲁棒性：通过对图像进行不同形式的变换，可以让模型学习到更具多样性的特征，从而提高模型在面对未知数据时的表现。例如，旋转、翻转可以让模型更好地应对不同的视角变化。
模拟真实场景：图像增强技术可以模拟现实世界中可能出现的各种情况，如光照变化、噪声干扰、模糊等，增强模型的实用性。
防止过拟合：在训练模型时，过拟合是一个常见问题，特别是在数据集较小的情况下。通过图像增强，可以有效地降低模型对特定样本的依赖性，提升模型的泛化能力。

3. 什么时候使用图像增强？

数据集较小：当训练数据不足时，图像增强是扩充数据量的有效方法。
模型过拟合：如果模型在训练集上表现很好，但在验证集或测试集上表现较差，图像增强可以帮助缓解过拟合问题。
多样性不足：当数据集中的样本具有较大相似性，或缺乏不同环境、不同条件下的样本时，图像增强可以增加数据的多样性。
应用场景复杂：当模型应用于复杂或多变的场景时，通过图像增强可以提前模拟这些变化，提高模型的适应能力。

总的来说，图像增强是提升模型性能的重要手段，特别是在数据有限或需要面对复杂场景时尤为有用。
在这里插入图片描述

4. 图像增强详细方法分类梳理

4.1 图像增强方法列表

增强方法	详细说明	特点
Flip	将图像水平翻转或垂直翻转，使图像左右或上下颠倒。	对称性增强，避免模型依赖方向信息。
90° Rotate	将图像按90度、180度或270度旋转。	增强模型对不同旋转角度的鲁棒性。
Crop	裁剪图像的某一部分以生成一个新的子图像。	关注特定区域，防止模型对背景信息的依赖。
Rotation	任意角度旋转图像而不是90度的倍数。	提供多样化的视角，增强模型对不同角度的适应性。
Shear	对图像进行倾斜变换，将图像的形状进行拉伸或扭曲。	增强模型对几何变形的鲁棒性。
Grayscale	将图像转换为灰度图像，仅保留亮度信息。	去除颜色信息，关注亮度和形状特征。
Hue	改变图像的色调，调整图像的整体颜色。	模拟不同的光照条件，增强模型对颜色变化的适应性。
Saturation	调整图像的饱和度，使颜色更加鲜艳或更加黯淡。	增强模型对颜色强度变化的鲁棒性。
Exposure	调整图像的曝光度，使图像变得更亮或更暗。	增强模型对不同光照条件的适应性。
Blur	对图像应用模糊滤镜，降低图像的清晰度。	模拟相机对焦不准确的情况，增强模型的鲁棒性。
Noise	向图像中添加随机噪声，如高斯噪声或椒盐噪声。	增强模型对噪声的鲁棒性，模拟传感器噪声或压缩失真。
Cutout	在图像上随机遮挡一个或多个区域，用纯黑色或其他颜色填充遮挡区域。	使模型更关注整体特征，避免过度依赖某一特定区域。
Mosaic	将多个图像组合在一起生成一个新图像，通常将图像分成不同的区域，然后重新排列。	提供更多样的训练样本，增加模型的泛化能力。

4.2 边界框增强方法

增强方法	详细说明	特点
Flip	对图像中的边界框进行水平或垂直翻转。	保持目标物体的定位不变，但方向改变。
90° Rotate	将包含边界框的图像旋转90度。	增强模型对不同旋转角度的目标检测能力。
Crop	裁剪图像和相应的边界框。	可以生成更加局部的检测目标，防止模型依赖背景信息。
Rotation	任意角度旋转图像中的目标和边界框。	增加检测目标的多样性和角度变化的适应性。
Shear	对图像及其边界框进行剪切变换。	提供对变形目标的检测能力，增强模型的几何鲁棒性。
Brightness	调整图像的亮度，同时对边界框不产生影响。	增强模型在不同光照条件下的目标检测能力。
Exposure	调整图像的曝光度，处理高曝光或低曝光图像中的目标检测。	增强模型对不同曝光条件的目标检测能力。
Blur	对图像进行模糊处理，目标仍然被边界框标记。	模拟相机对焦不准的情况，增强模型的鲁棒性。
Noise	向图像中添加随机噪声，仍保持边界框标注的准确性。	增强模型在噪声环境下的目标检测能力。

这些增强方法有助于在图像分类、目标检测等任务中生成更多样化的训练样本，增强模型的鲁棒性和泛化能力。

5. 参考资料

Introducing Bounding Box Level Augmentations

相关文章：

北京网站建设多少钱？

辽宁网页制作哪家好_网站建设

高端品牌网站建设_汉中网站制作

UIScrollView 的 pagingEnabled属性(UIScrollView默认一次滑动多少距离?)

掌握SQL的威力：批量更新与删除的艺术

如何在 Windows/Mac/在线/iPhone/Android 上将 PDF 转换为 Word

leetcode算法题之N皇后

软件测试要学习的基础知识——黑盒测试

静态路由与默认路由和实验以及ARP工作原理

动画展示梯度下降（二维）

XSS的DOM破坏

Linux·权限与工具-yum与vim

说一下Android中的IdleHandler

每日一问：Kafka消息丢失与堆积问题分析与解决方案

MFC在OPENGL循环绘制中添加进度条控件后运行速度变慢

设计模式 - 装饰器模式

在IntelliJ IDEA中使用Git推送项目

[手机Linux PostmarketOS]五, docker安装和使用

SegmentFault for Android 3.0 发布

【108天】Java——《Head First Java》笔记（第1-4章）

Android系统模拟器绘制实现概述

CSS盒模型深入

HTML-表单

learning koa2.x

Python socket服务器端、客户端传送信息

React Native移动开发实战-3-实现页面间的数据传递

WebSocket使用

聊聊redis的数据结构的应用

微信支付JSAPI，实测！终极方案

正则与JS中的正则

06-01 点餐小程序前台界面搭建

mysql面试题分组并合并列

继 XDL 之后，阿里妈妈开源大规模分布式图表征学习框架 Euler ...

无限可能性的探索：Amazon Lightsail轻量应用服务器引领数字化时代创新发展

ubuntu16.04 fastreid训练过程

埃文科技受邀出席2024 “数据要素×”生态大会

一文看懂数据清洗：缺失值、异常值和重复值的处理

#1014 : Trie树

#pragma once

#快捷键# 大学四年我常用的软件快捷键大全，教你成为电脑高手！！

(echarts)echarts使用时重新加载数据之前的数据存留在图上的问题

（附源码）ssm基于jsp高校选课系统毕业设计 291627

(生成器)yield与(迭代器)generator

（四）Linux Shell编程——输入输出重定向

（译）计算距离、方位和更多经纬度之间的点

（幽默漫画）有个程序员老公，是怎样的体验？

.gitignore不生效的解决方案

.NET Core 中的路径问题

.NET 使用 ILMerge 合并多个程序集，避免引入额外的依赖

.NET/ASP.NETMVC 大型站点架构设计—迁移Model元数据设置项（自定义元数据提供程序）...

.Net接口调试与案例

.php结尾的域名,【php】php正则截取url中域名后的内容

::前边啥也没有

@SuppressWarnings(unchecked)代码的作用

[ Linux ] git工具的基本使用（仓库的构建，提交）

[20180129]bash显示path环境变量.txt

[AI]文心一言爆火的同时，ChatGPT带来了这么多的开源项目你了解吗

[BZOJ5125]小Q的书架(决策单调性+分治DP+树状数组)