当前位置：首页 > news >正文

数据增强又突破了！升级版“双杀”两大顶会，实现无痛涨点

news 来源：原创 2024/9/19 20:44:21

数据收集和标注的艰难想必大家都有所体会，不仅耗时耗力还很贵，一般人顶不住。那怎么解决？你的“强”（数据增强）来了~

数据增强作为一种正则化技术，可以帮助我们在有限的数据下，提高模型的性能。这是因为它能通过在现有数据基础上进行微小改动，生成更多等价数据来扩展训练数据集，显著提高模型的泛化能力和鲁棒性。

因此这种涨点很猛的技术格外适合解决训练数据不足的问题，自然也就成了大热的研究方向，且现在除了经典方法，数据增强更是已经next level，出现了很多新方法，比如CVPR 2024的DiffuseMix，还有WACV 2024的目标检测数据增强。

除此以外，还有一些很值得学习的深度学习数据增强新方法，我从中挑选了10篇，简单提炼了可参考的创新点，希望可以给同学们提供论文灵感。

论文原文+开源代码需要的同学看文末

DiffuseMix: Label-Preserving DataAugmentation with Diffusion Models

方法：这篇论文介绍了DIFFUSEMIX，一种基于扩散模型的数据增强方法，通过结合自然图像和生成图像，并融入分形图像，来提高深度学习模型的泛化能力和对抗鲁棒性，在通用分类、细粒度分类、数据稀缺性等任务上实现卓越的性能，涨点显著。

创新点：

DIFFUSEMIX是一种基于扩散模型的数据增强技术，通过生成、连接和混合分形图像等步骤来创建最终的增强图像。
DIFFUSEMIX在各种任务中都展现出出色的性能，包括一般分类、细粒度分类、数据稀缺、微调和对抗鲁棒性。
DIFFUSEMIX在多个基准数据集上都表现出一致的性能提升，优于现有的SOTA图像增强方法。

Data Augmentation for Object Detection via Controllable Diffusion Models

方法：论文介绍了一种基于可控扩散模型和CLIP的目标检测数据增强方法。通过使用扩散模型进行填充和修复，可以生成具有高质量边界框注释的合成图像。

创新点：

提出了一种基于可控扩散模型和CLIP的目标检测数据增强方法。
通过生成合适的视觉先验来控制合成数据的生成，并利用类别校准的CLIP分数进行后过滤。
在MSCOCO的少样本设置、完整的PASCAL VOC数据集和选定的下游数据集上评估了该方法，并观察到了性能的提升。

MedAugment: Universal Automatic Data Augmentation Plug-in for Medical Image Analysis

方法：论文提出了一种名为MedAugment的自动数据增强方法，在医学图像分析（MIA）中解决了数据增强的挑战。该方法通过提出像素增强空间和空间增强空间，并排除可能破坏医学图像细节和特征的操作，实现了高效和有效的自动数据增强。此外，该方法还提出了一种新的采样策略，从这两个空间中随机选择有限数量的操作。

创新点：

提出了像素增强空间和空间增强空间，并采用新的采样策略和超参数映射关系，以有效解决自然图像和医学图像之间的差异。
进行了广泛的实验，对四个分类和三个分割数据集进行了测试，并证明了所提出的MedAugment的优越性。

AdaAugment: A Tuning-Free and Adaptive Approach to Enhance DataAugmentation

方法：论文提出了AdaAugment，这是一种创新且无需调优的自适应数据增强方法。通过根据在目标模型训练过程中获得的实时反馈，自适应调整数据增强操作的幅度，AdaAugment优化了数据的变异性。

创新点：

提出了一种创新的自适应数据增强方法，利用强化学习动态调整每个训练样本的增强幅度，以实时反馈从目标网络获得的信息来优化数据的可变性。
AdaAugment采用了一个由策略网络和目标网络组成的双模型架构。策略网络学习确定每个训练样本的增强操作的幅度，基于目标网络的实时反馈。目标网络同时利用这些自适应增强的样本进行训练。