当前位置: 首页 > news >正文

主流卷积神经网络CNN总结

ResNet(2015)残差神经网络

残差结构

ResNet50具体卷积结构图

ResNeXt(2016)加入了分组卷积的思想,将原ResNet网络中的block替换成由group分组的block,两者得到的feature map一致,只是参数量更少了。

并且当block层数≥3时才有意义。经过验证,group数一般设置为32会取得最好的效果,每组卷积核4d,d表示倍数。

DenseNet(2017) 稠密连接卷积神经网络,所有层之间的连接提高了特征重用,避免了过拟合,加上瓶颈层和压缩层,减小了模型参数。

SE-ResNet(2017) SENet的核心思想是通过自适应地调整通道间的特征重要性来提升网络的表达能力。SE-Block嵌入堆叠在ResNet中形成了SE-ResNet。

SENet的基本结构是在卷积层后添加了一个Squeeze-and-Excitation模块。该模块通过全局平均池化操作来获取通道间的特征关系,然后使用两个全连接层来学习通道的权重。

最后,通过乘法操作将学习到的权重应用于输入特征图,以增强有用的特征并抑制无用的特征。

引入通道注意力机制,可以在众多的输入信息中聚焦于对当前任务更为关键的信息,降低对其他信息的关注度,甚至过滤掉无关信息,并提高任务处理的效率和准确性。

Res2Net(2019) 加入了多尺度的思想,将输入的特征图分为几组(一般是4组),每一组滤波器先从一组输入特征图中进行特征提取,

然后与先前组生成的特征图和另一组输入的特征图一起被送到下一组卷积核进行处理。这个过程将一直持续到所有特征图都被处理完毕。

最终,所有特征图将被并联在一起然后通过一个 1×1 的卷积层进行信息融合

ResNeSt(2020) 在ResNeXt的分组卷积思想基础上,再结合SE-Net的通道注意力机制思想,形成了分组通道注意力机制(Split-Attention)

SE-Net的注意力机制:

SE-Net主要关注的是通道注意力机制。它利用Squeeze-and-Excitation(SE)模块来学习每个特征通道的重要性,并为每个通道生成一个权重。

这个权重是通过全局平均池化压缩特征图的空间维度后,经过全连接层学习得到的。

这样,SE-Net就能够根据输入数据的特性自适应地调整不同通道的特征响应,使得网络更加关注那些对任务更有帮助的通道。

ResNest的注意力机制:

ResNest则采用了一种分裂注意力(Split-Attention)机制。它首先将输入特征图分为多个组(或称为分支),每个组经过独立的卷积操作。

然后,通过跨通道的注意力权重将这些组的结果加权求和。这种分裂注意力的设计使得ResNest能够同时关注多个特征通道,并从不同的视角或角度提取信息。

相同点:两者都利用了注意力机制来提高网络对特征图的利用能力,

使网络能够更加关注对任务有贡献的特征。

不同点:SE-Net主要关注通道注意力,通过为每个通道生成权重来重新调整特征图;

 而ResNest则采用了分裂注意力的方式,从多个视角提取特征,并通过跨通道的注意力权重进行融合。此外,ResNest的分裂注意力机制更加适合并行计算,可以提高训练效率。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • MySQL5.7中增加的JSON特性的处理方法JSON_EXTRACT和JSON_ARRAY_APPEND以及MYSQL中JSON操作的方法大全
  • 小程序服务零工市场
  • 神经网络 归一化层
  • shell脚本(9.20)
  • 机器翻译之多头注意力(MultiAttentionn)在Seq2Seq的应用
  • 音视频入门基础:AAC专题(4)——ADTS格式的AAC裸流实例分析
  • 大健康裂变分销小程序开发
  • linux 之0号进程、1号进程、2号进程
  • 9月18日
  • 前端univer创建、编辑excel
  • Docker 以外置数据库方式部署禅道
  • .config、Kconfig、***_defconfig之间的关系和工作原理
  • Hadoop里面MapReduce的序列化与Java序列化比较
  • Java知识点小结3:内存回收
  • 关于c#中异步async和await的理解
  • 【译】理解JavaScript:new 关键字
  • 11111111
  • Cookie 在前端中的实践
  • CSS3 聊天气泡框以及 inherit、currentColor 关键字
  • CSS进阶篇--用CSS开启硬件加速来提高网站性能
  • ES6--对象的扩展
  • Java|序列化异常StreamCorruptedException的解决方法
  • JavaScript中的对象个人分享
  • Netty+SpringBoot+FastDFS+Html5实现聊天App(六)
  • PV统计优化设计
  • SAP云平台运行环境Cloud Foundry和Neo的区别
  • SQLServer之创建显式事务
  • Theano - 导数
  • WinRAR存在严重的安全漏洞影响5亿用户
  • 构造函数(constructor)与原型链(prototype)关系
  • 关于 Cirru Editor 存储格式
  • 京东美团研发面经
  • 类orAPI - 收藏集 - 掘金
  • 浅析微信支付:申请退款、退款回调接口、查询退款
  • 实习面试笔记
  • 使用Gradle第一次构建Java程序
  • 新书推荐|Windows黑客编程技术详解
  • 一、python与pycharm的安装
  • 用quicker-worker.js轻松跑一个大数据遍历
  • 正则学习笔记
  • 看到一个关于网页设计的文章分享过来!大家看看!
  • MyCAT水平分库
  • ​14:00面试,14:06就出来了,问的问题有点变态。。。
  • ​LeetCode解法汇总2696. 删除子串后的字符串最小长度
  • ​zookeeper集群配置与启动
  • # 安徽锐锋科技IDMS系统简介
  • # 计算机视觉入门
  • # 数据结构
  • #if和#ifdef区别
  • (cos^2 X)的定积分,求积分 ∫sin^2(x) dx
  • (附源码)ssm高校运动会管理系统 毕业设计 020419
  • (牛客腾讯思维编程题)编码编码分组打印下标题目分析
  • (算法)Game
  • (一)spring cloud微服务分布式云架构 - Spring Cloud简介
  • **《Linux/Unix系统编程手册》读书笔记24章**