当前位置: 首页 > news >正文

数据增强又突破了!升级版“双杀”两大顶会,实现无痛涨点

数据收集和标注的艰难想必大家都有所体会,不仅耗时耗力还很贵,一般人顶不住。那怎么解决?你的“强”(数据增强)来了~

数据增强作为一种正则化技术,可以帮助我们在有限的数据下,提高模型的性能。这是因为它能通过在现有数据基础上进行微小改动,生成更多等价数据来扩展训练数据集,显著提高模型的泛化能力和鲁棒性。

因此这种涨点很猛的技术格外适合解决训练数据不足的问题,自然也就成了大热的研究方向,且现在除了经典方法,数据增强更是已经next level,出现了很多新方法,比如CVPR 2024的DiffuseMix,还有WACV 2024的目标检测数据增强。

除此以外,还有一些很值得学习的深度学习数据增强新方法,我从中挑选了10篇,简单提炼了可参考的创新点,希望可以给同学们提供论文灵感。

论文原文+开源代码需要的同学看文末

DiffuseMix: Label-Preserving DataAugmentation with Diffusion Models

方法:这篇论文介绍了DIFFUSEMIX,一种基于扩散模型的数据增强方法,通过结合自然图像和生成图像,并融入分形图像,来提高深度学习模型的泛化能力和对抗鲁棒性,在通用分类、细粒度分类、数据稀缺性等任务上实现卓越的性能,涨点显著。

创新点:

  • DIFFUSEMIX是一种基于扩散模型的数据增强技术,通过生成、连接和混合分形图像等步骤来创建最终的增强图像。

  • DIFFUSEMIX在各种任务中都展现出出色的性能,包括一般分类、细粒度分类、数据稀缺、微调和对抗鲁棒性。

  • DIFFUSEMIX在多个基准数据集上都表现出一致的性能提升,优于现有的SOTA图像增强方法。

Data Augmentation for Object Detection via Controllable Diffusion Models

方法:论文介绍了一种基于可控扩散模型和CLIP的目标检测数据增强方法。通过使用扩散模型进行填充和修复,可以生成具有高质量边界框注释的合成图像。

创新点:

  • 提出了一种基于可控扩散模型和CLIP的目标检测数据增强方法。

  • 通过生成合适的视觉先验来控制合成数据的生成,并利用类别校准的CLIP分数进行后过滤。

  • 在MSCOCO的少样本设置、完整的PASCAL VOC数据集和选定的下游数据集上评估了该方法,并观察到了性能的提升。

MedAugment: Universal Automatic Data Augmentation Plug-in for Medical Image Analysis

方法:论文提出了一种名为MedAugment的自动数据增强方法,在医学图像分析(MIA)中解决了数据增强的挑战。该方法通过提出像素增强空间和空间增强空间,并排除可能破坏医学图像细节和特征的操作,实现了高效和有效的自动数据增强。此外,该方法还提出了一种新的采样策略,从这两个空间中随机选择有限数量的操作。

创新点:

  • 提出了像素增强空间和空间增强空间,并采用新的采样策略和超参数映射关系,以有效解决自然图像和医学图像之间的差异。

  • 进行了广泛的实验,对四个分类和三个分割数据集进行了测试,并证明了所提出的MedAugment的优越性。

AdaAugment: A Tuning-Free and Adaptive Approach to Enhance DataAugmentation

方法:论文提出了AdaAugment,这是一种创新且无需调优的自适应数据增强方法。通过根据在目标模型训练过程中获得的实时反馈,自适应调整数据增强操作的幅度,AdaAugment优化了数据的变异性。

创新点:

  • 提出了一种创新的自适应数据增强方法,利用强化学习动态调整每个训练样本的增强幅度,以实时反馈从目标网络获得的信息来优化数据的可变性。

  • AdaAugment采用了一个由策略网络和目标网络组成的双模型架构。策略网络学习确定每个训练样本的增强操作的幅度,基于目标网络的实时反馈。目标网络同时利用这些自适应增强的样本进行训练。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“数据增强”获取全部论文+开源代码

码字不易,欢迎大家点赞评论收藏

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • Mybatis批量操作
  • CISP备考题库(八)
  • JavaScript match() 方法
  • 如何在Android上实现RTSP服务器
  • 【案例71】配置https之后 IE打不开登陆页面 Uclient没有问题
  • JS日期转化指定格式,获取月/周日期区间
  • Spring Boot入门:构建你的首个Spring Boot应用
  • Laya2.x出包alipay小游戏
  • 数据恢复免费版工具大比拼,哪款才是你的“救星”?
  • Linux运维篇-tigervnc工具的使用
  • 机器学习特征-学习篇
  • rtems 5.3 qemu realview_pbx_a9 环境搭建:生成 rtems arm 工具链
  • Maven下载安装
  • 物联网之Arduino编程语言、条件语句、循环语句、变量、数组、函数
  • IP协议及相关特性
  • @jsonView过滤属性
  • 【编码】-360实习笔试编程题(二)-2016.03.29
  • conda常用的命令
  • GraphQL学习过程应该是这样的
  • JavaScript 无符号位移运算符 三个大于号 的使用方法
  • JavaScript学习总结——原型
  • Laravel 菜鸟晋级之路
  • Linux gpio口使用方法
  • Spring Cloud Alibaba迁移指南(一):一行代码从 Hystrix 迁移到 Sentinel
  • 分享一份非常强势的Android面试题
  • 深入浏览器事件循环的本质
  • 使用API自动生成工具优化前端工作流
  • 系统认识JavaScript正则表达式
  • 用Visual Studio开发以太坊智能合约
  • 这几个编码小技巧将令你 PHP 代码更加简洁
  • 中文输入法与React文本输入框的问题与解决方案
  • 【云吞铺子】性能抖动剖析(二)
  • MyCAT水平分库
  • 支付宝花15年解决的这个问题,顶得上做出十个支付宝 ...
  • !!【OpenCV学习】计算两幅图像的重叠区域
  • # Redis 入门到精通(七)-- redis 删除策略
  • #07【面试问题整理】嵌入式软件工程师
  • $con= MySQL有关填空题_2015年计算机二级考试《MySQL》提高练习题(10)
  • (1)svelte 教程:hello world
  • (175)FPGA门控时钟技术
  • (1综述)从零开始的嵌入式图像图像处理(PI+QT+OpenCV)实战演练
  • (2)(2.4) TerraRanger Tower/Tower EVO(360度)
  • (Java)【深基9.例1】选举学生会
  • (NO.00004)iOS实现打砖块游戏(九):游戏中小球与反弹棒的碰撞
  • (ZT)一个美国文科博士的YardLife
  • (八)Docker网络跨主机通讯vxlan和vlan
  • (八)光盘的挂载与解挂、挂载CentOS镜像、rpm安装软件详细学习笔记
  • (补充):java各种进制、原码、反码、补码和文本、图像、音频在计算机中的存储方式
  • (分享)一个图片添加水印的小demo的页面,可自定义样式
  • (附源码)python房屋租赁管理系统 毕业设计 745613
  • (回溯) LeetCode 77. 组合
  • (四)linux文件内容查看
  • (四十一)大数据实战——spark的yarn模式生产环境部署
  • (文章复现)基于主从博弈的售电商多元零售套餐设计与多级市场购电策略
  • (一)C语言之入门:使用Visual Studio Community 2022运行hello world