当前位置: 首页 > news >正文

机器学习笔记 - Albumentations库实现的图像增强功能一览

一、Albumentations库简介

        Albumentations库致力于用更少的数据做更多的事情。

        Albumentations 是一种计算机视觉工具,可以提高深度卷积神经网络的性能。该库广泛用于工业、深度学习研究、机器学习竞赛和开源项目。

        Albumentations 是一个用于快速灵活的图像增强的 Python 库。Albumentations 有效地实现了丰富多样的图像变换操作,这些操作针对性能进行了优化,同时为不同的计算机视觉任务(包括对象分类、分割和检测)提供了简洁而强大的图像增强接口。

        Albumentations 支持不同的计算机视觉任务,例如分类、语义分割、实例分割、对象检测和姿势估计。

         Albumentations 可以很好地处理来自不同领域的数据:照片、医学图像、卫星图像、制造和工业应用、生成对抗网络。

        Albumentations 可以与各种深度学习框架一起使用,例如PyTorch和Keras。该库是PyTorch 生态系统的一部分。 MMDetection 和YOLOv5 使用了 Albumentations。

Albumentations: fast and flexible image augmentationshttps://albumentations.ai/

二、可进行哪些图像增强

1、模糊/高级模糊

        模糊:使用随机大小的内核模糊输入图像。

        高级模糊:使用具有随机选择参数的广义正态滤波器模糊输入图像。此变换还在卷积之前将乘性噪声添加到生成的内核。

2、CLAHE

        Contrast Limited Adaptive Histogram Equalization。

        将对比度受限的自适应直方图均衡应用于输入图像。

3、CenterCrop

        裁剪输入的中心部分。

4、图像通道相关操作

        在输入图像中随机丢弃通道。

        随机重新排列输入 RGB 图像的通道。

5、CoarseDropout

        删除图像中的一些子区域

 6、随机改变图像的亮度、对比度和饱和度

        随机改变图像的亮度、对比度和饱和度。 与来自 torchvision 的 ColorJitter 相比,这种变换给出了一些不同的结果,因为 Pillow(在 torchvision 中使用)和 OpenCV(在 Albumentations 中使用)通过不同的公式将图像转换为 HSV 格式。 另一个区别 - Pillow 使用 uint8 溢出,Albumentations 使用值饱和。

7、裁剪

        从图像中裁剪部分区域。

8、散焦变换

        应用散焦变换。 参考论文 https://arxiv.org/abs/1903.12261。

9、降采样

        通过对图像的缩放后放大,降低图像质量。

 10、弹性变换

        基于,https://gist.github.com/ernestum/601cdf56d2b424757de5

11、Emboss

        将浮雕效果应用于原图像

12、均衡图像直方图

        将均衡直方图应用于原图像

13、FancyPCA 增强 RGB 图像

        使用 Krizhevsky 的论文“ImageNet Classification with Deep Convolutional Neural Networks”中的 FancyPCA 增强 RGB 图像

14、翻转

        水平、垂直或水平和垂直翻转输入。

15、高斯噪声

        将高斯噪声应用于输入图像。

16、高斯模糊

        使用具有随机内核大小的高斯滤波器模糊输入图像。

17、毛玻璃效果

        将玻璃噪声应用于输入图像。

18、Grid Distortion

 19、ISONoise

        应用相机传感器噪声。

20、图像压缩

        减少图像的 Jpeg、WebP 压缩。

21、反转图像

        通过从 255 中减去像素值来反转输入图像。

22、运动模糊

        使用随机大小的内核将运动模糊应用于输入图像。

23、中值滤波

        使用具有随机孔径线性大小的中值滤波器模糊输入图像。

24、乘性噪声

        将图像乘以随机数或数字数组。

25、光学畸变

未完

相关文章:

  • 软考-存储系统
  • 大学生网页设计制作作业实例代码 (全网最全,建议收藏) HTML+CSS+JS
  • GAN Step By Step -- Step4 CGAN
  • HackerRank 算法刷题笔记(一),基于Go语言
  • 【Linux篇】第十三篇——信号(概念+信号的产生+阻塞信号+捕捉信号)
  • Android Jetpack系列之MVI架构
  • 十分钟之内实现stack和queue?容器适配器是什么?priority_queue不是队列?
  • 基于Keras实战项目-猫狗熊猫分类大战
  • 基于 Echarts + Python Flask 动态实时大屏( 附代码)
  • 并查集原理及模拟实现
  • 【Redis】大key的处理
  • T-3.2-把Redis当作消息队列合不合适
  • 简单个人静态HTML网页设计作品 DIV布局个人介绍网页模板代码 DW个人网站制作成品 web网页制作与实现
  • java基于springboot+element的实现医院预约挂号系统 nodejs
  • 在vue项目中使用canvas实现甘特图
  • 【Leetcode】101. 对称二叉树
  • [Vue CLI 3] 配置解析之 css.extract
  • Android开源项目规范总结
  • Create React App 使用
  • iOS小技巧之UIImagePickerController实现头像选择
  • Magento 1.x 中文订单打印乱码
  • Octave 入门
  • Sublime Text 2/3 绑定Eclipse快捷键
  • Vue官网教程学习过程中值得记录的一些事情
  • Webpack4 学习笔记 - 01:webpack的安装和简单配置
  • Xmanager 远程桌面 CentOS 7
  • 给github项目添加CI badge
  • 如何邀请好友注册您的网站(模拟百度网盘)
  • 如何在GitHub上创建个人博客
  • Spring第一个helloWorld
  • # Swust 12th acm 邀请赛# [ K ] 三角形判定 [题解]
  • #include到底该写在哪
  • #QT(智能家居界面-界面切换)
  • ${ }的特别功能
  • (1)STL算法之遍历容器
  • (NO.00004)iOS实现打砖块游戏(九):游戏中小球与反弹棒的碰撞
  • (八)Spring源码解析:Spring MVC
  • (笔记)Kotlin——Android封装ViewBinding之二 优化
  • (附源码)springboot助农电商系统 毕业设计 081919
  • (十六)Flask之蓝图
  • (已更新)关于Visual Studio 2019安装时VS installer无法下载文件,进度条为0,显示网络有问题的解决办法
  • (转)C#调用WebService 基础
  • (转)C语言家族扩展收藏 (转)C语言家族扩展
  • (转)http协议
  • (转)linux 命令大全
  • *ST京蓝入股力合节能 着力绿色智慧城市服务
  • .gitignore文件—git忽略文件
  • .htaccess配置重写url引擎
  • .NET/C# 判断某个类是否是泛型类型或泛型接口的子类型
  • .NET/C# 在 64 位进程中读取 32 位进程重定向后的注册表
  • @ComponentScan比较
  • @ModelAttribute使用详解
  • [ArcPy百科]第三节: Geometry信息中的空间参考解析
  • [BZOJ 4034][HAOI2015]T2 [树链剖分]
  • [CF]Codeforces Round #551 (Div. 2)