当前位置: 首页 > news >正文

YOLOv9改进,YOLOv9主干网络替换为GhostNetV3(2024年华为提出的轻量化架构,全网首发),助力涨点


在这里插入图片描述

摘要

GhostNetV3 是由华为诺亚方舟实验室的团队发布的,于2024年4月发布。
在这里插入图片描述

摘要:紧凑型神经网络专为边缘设备上的应用设计,具备更快的推理速度,但性能相对适中。然而,紧凑型模型的训练策略目前借鉴自传统模型,这忽略了它们在模型容量上的差异,可能阻碍紧凑型模型的性能提升。在本文中,通过系统地研究不同训练成分的影响,我们介绍了一种用于紧凑型模型的强大训练策略。我们发现,适当的重参数化和知识蒸馏设计对于训练高性能的紧凑型模型至关重要,而一些常用于训练传统模型的数据增强方法(如 Mixup 和 CutMix)反而会导致性能下降。作者在 ImageNet-1K 数据集上的实验表明,为紧凑型模型设计的专门训练策略适用于各种架构,包括 GhostNetV3、MobileNetV2 和 ShuffleNetV2。具体而言,GhostNetV3 1.3× 在移动设备上以仅 269M FLOPs 和 14.46ms 的延迟实现了 79.1% 的 top-1 准确率,远超其常规训练的对手。此外,还可以扩展到目标检测场景。

理论介绍

GhostNetV3 提供了以下几种常见的模型权重,不同宽度缩放因子(Width Scaling):

  • 0.5x: 较小模型深度,用于资源更受限的场景。
  • 1.0x: 标准模型。
  • 1.3x: 模型深度比1.0x更深。
  • 1.6x: 更大的模型版本,适用于计算资源较多的设备。

大家可以根据不同场景选择合适的模型宽度缩放因子,本文选择 0.5,具体可见第二章的代码。

GhostNetV2 和 GhostNetV3 的架构如下:
在这里插入图片描述

GhostNets(GhostNetV1 和 GhostNetV2)是为在移动设备上高效推理而设计的最先进的紧凑型模型。其关键架构是 Ghost 模块,可以通过廉价操作生成更多特征图来替换原始卷积。在普通卷积中,输出特征 Y 通过 Y = X ∗ W 获得,其中 W ∈ R cout×cin×k×k 是卷积核,X 是输入特征。cin 和 cout 分别表示输入和输出通道维度。k 是核大小,∗ 表示卷积操作。Ghost 模块通过两个步骤减少普通卷积的参数和计算成本。

GhostNetV3 引入了多分支重参数化机制,通过在卷积层中添加额外的平行分支来改善性能。这些分支在训练过程中提供更多的表征能力,最终通过将多个分支重组为一个卷积层来实现推理时的高效性。通过添加配备 BatchNorm 层的重复分支将再参数化引入紧凑型模型。
GhostNetV3 在 GhostNetV2 的基础上进行了进一步的优化,主要体现如下:

  • 重参数化训练 (Training of Convolution):GhostNetV3 引入了

相关文章:

  • 作家依靠AI一年内创作120部作品
  • 微信小程序实战教程:轻松实现列表批量选择功能
  • Python自然语言处理之spacy模块介绍、安装与常见操作案例
  • 从零开始手写STL库:Stack
  • 【质优价廉】GAP9 AI算力处理器赋能智能可听耳机,超低功耗畅享未来音频体验!
  • 【C语言内存管理】第三章 堆内存管理
  • 《ToDesk 云电脑、易腾云、青椒云移动端体验实测:让手机秒变超级电脑》
  • ARM 服务器上安装 OpenEuler (欧拉)
  • 银河麒麟桌面操作系统V10登录闪退问题解决
  • python并发编程实战
  • R 语言 | 取数据框一列子集时,如何保持数据框结构?drop=F
  • 【Python】YOLO牛刀小试:快速实现视频物体检测
  • Windows批处理文件编写指南
  • GEE数据集:全球城市热岛强度(UHII)数据集(更新)
  • 一起了解AI的发展历程和AGI的未来展望
  • 2017-08-04 前端日报
  • angular2 简述
  • CNN 在图像分割中的简史:从 R-CNN 到 Mask R-CNN
  • HTTP那些事
  • HTTP--网络协议分层,http历史(二)
  • iOS 系统授权开发
  • learning koa2.x
  • Quartz实现数据同步 | 从0开始构建SpringCloud微服务(3)
  • Storybook 5.0正式发布:有史以来变化最大的版本\n
  • weex踩坑之旅第一弹 ~ 搭建具有入口文件的weex脚手架
  • 个人博客开发系列:评论功能之GitHub账号OAuth授权
  • 给初学者:JavaScript 中数组操作注意点
  • 三栏布局总结
  • 使用parted解决大于2T的磁盘分区
  • 网络应用优化——时延与带宽
  • 小程序 setData 学问多
  • ​Base64转换成图片,android studio build乱码,找不到okio.ByteString接腾讯人脸识别
  • !! 2.对十份论文和报告中的关于OpenCV和Android NDK开发的总结
  • !$boo在php中什么意思,php前戏
  • #define 用法
  • #中国IT界的第一本漂流日记 传递IT正能量# 【分享得“IT漂友”勋章】
  • (07)Hive——窗口函数详解
  • (4)通过调用hadoop的java api实现本地文件上传到hadoop文件系统上
  • (HAL)STM32F103C6T8——软件模拟I2C驱动0.96寸OLED屏幕
  • (独孤九剑)--文件系统
  • (二)七种元启发算法(DBO、LO、SWO、COA、LSO、KOA、GRO)求解无人机路径规划MATLAB
  • (附源码)spring boot智能服药提醒app 毕业设计 102151
  • (附源码)ssm教材管理系统 毕业设计 011229
  • (六)软件测试分工
  • (转)JVM内存分配 -Xms128m -Xmx512m -XX:PermSize=128m -XX:MaxPermSize=512m
  • ./configure,make,make install的作用
  • .NET 4 并行(多核)“.NET研究”编程系列之二 从Task开始
  • .NET MVC之AOP
  • .NET Reactor简单使用教程
  • .net Stream篇(六)
  • .net 打包工具_pyinstaller打包的exe太大?你需要站在巨人的肩膀上-VC++才是王道
  • .NET6使用MiniExcel根据数据源横向导出头部标题及数据
  • .net经典笔试题
  • .net通过类组装数据转换为json并且传递给对方接口
  • .net图片验证码生成、点击刷新及验证输入是否正确