当前位置: 首页 > news >正文

卷积神经网络 - 卷积与池化作为一种无限强的先验篇

序言

在深度学习的浩瀚星空中,卷积神经网络( CNN \text{CNN} CNN)以其卓越的特征提取能力,成为了处理图像和视频等复杂数据的关键工具。其中,卷积与池化操作作为 CNN \text{CNN} CNN的两大基石,不仅定义了网络如何“看”世界,还隐含了一种无限强大的先验知识——即局部连接性、权重共享以及空间层次性。这些先验知识,如同智慧的灯塔,指引着网络在数据海洋中高效航行,自动学习并抽象出高层次的特征表示,从而赋予机器以视觉理解和分析的能力。

卷积与池化作为一种无限强的先验

  • 回忆一下应用数学与机器学习基础 - 贝叶斯统计篇中先验概率分布 ( prior probability distribution \text{prior probability distribution} prior probability distribution) 的概念。这是一个模型参数的概率分布,它刻画了在我们看到数据之前我们认为什么样的模型是合理的信念。

  • 先验被认为是强或者弱取决于先验中概率密度的集中程度

    • 弱先验具有较高的熵值,例如方差很大的高斯分布,这样的先验允许数据对于参数的改变具有或多或少的自由性。
    • 强先验具有较低的熵值,例如方差很小的高斯分布,这样的先验在决定参数最终取值时起着更加积极的作用。
  • 一个无限强的先验对一些参数的概率置零并且要求禁止对这些参数赋值,无论数据对于这些参数的值给出了多大的支持。

  • 我们可以把卷积神经网络想成和全连接网络类似,但对于这个全连接网络的权值有一个无限强的先验

    • 这个无限强的先验是说一个隐藏单元的权值必须和它邻居的权值相等,但在空间中改变。
    • 这个先验也要求除了那些处在隐藏单元空间连续的小的接收域以内的权值外,其余的权值都为零。
    • 总之,我们可以把卷积的使用当作是对网络中一层的参数引入了一个无限强的先验概率分布。
    • 这个先验是说该层应该学得的函数只包含局部连接关系并且对平移具有等变性。
    • 类似的,使用池化也是一个无限强的先验:每一个单元都具有对少量平移的不变性。
  • 当然,把卷积神经网络当作一个具有无限强先验的全连接网络来实现会导致极大的计算浪费。但把卷积神经网络想成具有无限强先验的全连接网络可以帮助我们更好地洞察卷积神经网络是如何工作的。

  • 其中一个关键的洞察是卷积和池化可能导致欠拟合

    • 与任何其他先验类似,卷积和池化只有当先验的假设合理且正确时才有用。
    • 如果一项任务依赖于保存精确的空间信息,那么在所有的特征上使用池化将会增大训练误差。
    • 一些卷积神经网络( Szegedy et al., 2014a \text{Szegedy et al., 2014a} Szegedy et al., 2014a) 为了既获得具有较高不变性的特征又获得当平移不变性不合理时不会导致欠拟合的特征,被设计成在一些通道上使用池化而在另一些通道上不使用。
    • 当一项任务涉及到要对输入中相隔较远的信息进行合并时,那么卷积所需要的先验可能就不正确了。
  • 另一个关键洞察是当我们比较卷积模型的统计学习表现时,只能以基准中的其他卷积模型作为比较的对象

    • 其他不使用卷积的模型即使我们把图像中的所有像素点都置换后依然有可能进行学习。
    • 对于许多图像数据集,还有一些分别的基准,有些是针对那些具有置换不变性 ( permutation invariant \text{permutation invariant} permutation invariant) 并且必须通过学习发现拓扑结构的模型,还有一些是针对设计者将空间关系的知识通过硬编码给了它们的模型。

总结

  • 卷积与池化,作为 CNN \text{CNN} CNN设计中最为精妙的部分,其背后蕴含的无限强先验,是深度学习能够跨越传统机器学习界限,实现复杂模式识别的关键所在。

  • 卷积操作通过局部感受野和权重共享,有效降低了模型参数量,同时捕捉到了图像中的局部特征及其空间关系;而池化操作则进一步强化了特征的尺度不变性和鲁棒性,通过降维减少了计算量,同时保留了最重要的信息。二者相辅相成,共同构建了一个强大的特征金字塔,使得 CNN \text{CNN} CNN能够在无需人工干预的情况下,自动从原始数据中挖掘出深层次的抽象特征。

  • 因此,卷积与池化不仅是技术上的创新,更是对自然世界理解方式的深刻洞察,它们以无限强的先验为基石,支撑起了深度学习在图像识别、视频分析等领域内的辉煌成就。

往期内容回顾

应用数学与机器学习基础 - 容量、过拟合和欠拟合篇
应用数学与机器学习基础 - 贝叶斯统计篇

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • AI智能名片小程序在促销性内容营销中的创新应用与策略分析
  • 数据结构(8):排序
  • 强光照射对半导体材料在紫外线下稳定性的影响
  • AutoDL下huggingface下载模型位置问题
  • Java之类和对象
  • 手机三要素接口怎么对接呢?(一)
  • 【AI大模型】大模型应用开发学习线路
  • Mysql的聚集索引、散列度、联合索引以及回表和覆盖索引
  • (STM32笔记)九、RCC时钟树与时钟 第二部分
  • Java中等题-最长回文子串(力扣)
  • (vue)el-cascader级联选择器按勾选的顺序传值,摆脱层级约束
  • 技术周总结 2024.07.29 ~ 08.04周日(MyBatis, 极限编程)
  • Cocos Creator2D游戏开发(9)-飞机大战(7)-爆炸效果
  • 使用ImDisk将Python安装到RAM磁盘提高运行速度
  • web小游戏开发:2048(完)移动操作及动画效果
  • python3.6+scrapy+mysql 爬虫实战
  • 0x05 Python数据分析,Anaconda八斩刀
  • 2017-08-04 前端日报
  • Apache Pulsar 2.1 重磅发布
  • Consul Config 使用Git做版本控制的实现
  • gcc介绍及安装
  • iOS | NSProxy
  • JavaScript 一些 DOM 的知识点
  • JSONP原理
  • mysql 数据库四种事务隔离级别
  • Yii源码解读-服务定位器(Service Locator)
  • 创建一种深思熟虑的文化
  • 基于Volley网络库实现加载多种网络图片(包括GIF动态图片、圆形图片、普通图片)...
  • 老板让我十分钟上手nx-admin
  • 如何学习JavaEE,项目又该如何做?
  • 设计模式 开闭原则
  • 由插件封装引出的一丢丢思考
  • 最近的计划
  • 【运维趟坑回忆录】vpc迁移 - 吃螃蟹之路
  • 微龛半导体获数千万Pre-A轮融资,投资方为国中创投 ...
  • ​LeetCode解法汇总2583. 二叉树中的第 K 大层和
  • ## 1.3.Git命令
  • #{}和${}的区别是什么 -- java面试
  • (2)空速传感器
  • (6)设计一个TimeMap
  • (BAT向)Java岗常问高频面试汇总:MyBatis 微服务 Spring 分布式 MySQL等(1)
  • (Redis使用系列) Springboot 在redis中使用BloomFilter布隆过滤器机制 六
  • (不用互三)AI绘画工具应该如何选择
  • (定时器/计数器)中断系统(详解与使用)
  • (二)pulsar安装在独立的docker中,python测试
  • (二)什么是Vite——Vite 和 Webpack 区别(冷启动)
  • (仿QQ聊天消息列表加载)wp7 listbox 列表项逐一加载的一种实现方式,以及加入渐显动画...
  • (每日持续更新)jdk api之StringBufferInputStream基础、应用、实战
  • (十)c52学习之旅-定时器实验
  • (一)插入排序
  • (转)Oracle 9i 数据库设计指引全集(1)
  • (转)微软牛津计划介绍——屌爆了的自然数据处理解决方案(人脸/语音识别,计算机视觉与语言理解)...
  • (转)为C# Windows服务添加安装程序
  • **《Linux/Unix系统编程手册》读书笔记24章**
  • .360、.halo勒索病毒的最新威胁:如何恢复您的数据?