当前位置: 首页 > news >正文

深度学习——day34 读论文:深度 ReLU 网络在特征提取和泛化中的深度选择(2022 Q1)

深度 ReLU 网络在特征提取和泛化中的深度选择

  • 资源下载(笔记,pdf & 思维导图)
  • 笔记正文(小绿鲸记笔记格式有点乱,抱歉)
  • chap3 提取单个数据特征时深度ReLU网络的深度选择
    • 3.1 Data Features
    • 3.2 提取群结构的深度选择
    • 3.3 用于提取平滑度特征的深度网
  • chap4 提取复合数据特征的深度选择
    • 4.1 定理3:网络深度对于提取复合特征不是唯一的,只要它大于某个级别即可
    • 4.2 深度网络在特征提取中的两个重要优势:
  • chap5 在深层网络上实现ERM的泛化误差分析
    • 5.1 empirical risk minimization
    • 5.2 根据定理1、2和3
    • 5.3 Fig.4
    • 5.4 定理4:从理论上讲,定理4表明,有许多深度可以达到相似的最优泛化误差界
  • chap6 实验
    • 6.5 泛化能力验证
    • 6.6 地震烈度预测的应用
  • chap7 主要贡献
    • 7.1
    • 7.2
    • 7.3
    • 7.4

资源下载(笔记,pdf & 思维导图)

点击跳转我的资源

笔记正文(小绿鲸记笔记格式有点乱,抱歉)

深度学习的核心是采用具有一定结构的深度神经网络 来提取数据特征,同时设计目标驱动算法。如图一所示,深度学习体现了特征提取算法的实用性。

chap3 提取单个数据特征时深度ReLU网络的深度选择

3.1 Data Features

Definition 1::利普希茨条件

f 的平滑度特征不足以绕过维数的诅咒,这需要x的额外结构特征,为此,引入以下输入的组结构特征

Definition 2:用组结构描述不同输入变量之间的关系

3.2 提取群结构的深度选择

引理3:说明了深度在提取结构特征方面的能力,本文在提取结构特征时追求深度和自由参数数量之间的权衡

引理4:表现出深度和参数之间的权衡,并消除了特征-深度的对应关系

定理1:显示了深度ReLU网络在提取稀疏多项式特征方面的性能

3.3 用于提取平滑度特征的深度网

定理2:深度ReLU网络在提取平滑度特征时至少不比浅网差

chap4 提取复合数据特征的深度选择

4.1 定理3:网络深度对于提取复合特征不是唯一的,只要它大于某个级别即可

4.2 深度网络在特征提取中的两个重要优势:

与经典的串联处理不同,深层网络通过体现其相互作用而成功地提取了复合特征,从而降低了容量成本

深度神经网络在提取单个特征和复合特征方面的多功能性,即每个特征对应于多个深度,反之亦然

深网提取复合特征的两个推论

chap5 在深层网络上实现ERM的泛化误差分析

5.1 empirical risk minimization

(经验风险最小化 ERM)

在理论分析中,从模型选择的角度关注深度的力量,目的是在不考虑优化算法的可用性的情况下,推导在深度remu网络上实现ERM的泛化误差

5.2 根据定理1、2和3

特征提取的准确性随着深网容量的增加而降低,从而导致ERM的偏差很小。但是,过大的容量会使ERM对噪声敏感,并导致较大的差异。通过平衡偏差和方差来获得ERM的最佳泛化性能
o
o

5.3 Fig.4

o

(a) 对于深度网络上的ERM,问题在于容量取决于深度和自由参数的数量


(b)曲线 “A” 中的所有(L,n)对 共享相同的共享相同的覆盖编号范围

o

5.4 定理4:从理论上讲,定理4表明,有许多深度可以达到相似的最优泛化误差界

chap6 实验

在本节中,介绍玩具模拟和真实数据实验,以显示深度在特征选择和预测中的作用
o
o

6.5 泛化能力验证

o

Table3:网络的最佳宽度候选项


Fig 10.记录了具有不同深度的深网的最佳MSE和成功收敛的速率。
① 在仿真中,证明了在深度网络中将特征提取与目标驱动学习相结合是可行的。
② 实际上,具有四层的深网可以显着提高浅网的性能

o

6.6 地震烈度预测的应用

o

真实数据实验:Table5 ——5层深层网络具有最佳性能,而具有其他深度的网络无法与支持向量机 (SVM)竞争。

chap7 主要贡献

7.1

在相同的容量成本下 (通过覆盖数量),证明了深网在提取组结构特征方面优于浅网

7.2

证明了深remu网是提取平滑度特征的最佳工具之一

7.3

严格证明了特征对深度和反之的适应性,从而得出了在深度网络上实现经验风险最小化的最佳学习率

7.4

进行了广泛的数值实验,包括玩具模拟和真实数据验证,以显示深度网络在特征提取和泛化方面的出色表现。

相关文章:

  • STM32G474产生一个锯齿波
  • 蓝队视角下的防御体系怎样进行突破
  • 排序算法 | 快排、冒泡、堆排、归并、基数、递归、希尔、计数
  • [平台运维、Hadoop]kafka streams概述
  • 【祝福伟大的祖国】Java Web 9.2 Request 对象 9.2.5 请求参数中文乱码问题
  • 《When you are old》一如苇中的风,轻柔却难忘
  • JavaFX实战:模拟电子琴弹奏效果,鼠标弹奏一曲piano送给大家
  • 基于VC++和AT89C52单片机的数字存储示波器设计
  • labview与stm32通信
  • OpenHarmony适配移植:X86、ARM、RISC-V、MIPS、LoongArch芯片架构简析
  • DBeaver manual
  • 图解redis(三)——功能篇
  • 数据库的约束和设计
  • Lesson 1 A private conversation
  • 第一季:9SpringMVC中如何解决POST请求中文乱码问题,GET的又如何处理呢【Java面试题】
  • Angularjs之国际化
  • AngularJS指令开发(1)——参数详解
  • CAP理论的例子讲解
  • ES6 学习笔记(一)let,const和解构赋值
  • es的写入过程
  • hadoop集群管理系统搭建规划说明
  • If…else
  • JavaWeb(学习笔记二)
  • JDK 6和JDK 7中的substring()方法
  • js继承的实现方法
  • 代理模式
  • 关键词挖掘技术哪家强(一)基于node.js技术开发一个关键字查询工具
  • 回顾 Swift 多平台移植进度 #2
  • 技术胖1-4季视频复习— (看视频笔记)
  • 那些年我们用过的显示性能指标
  • 容器化应用: 在阿里云搭建多节点 Openshift 集群
  • 如何选择开源的机器学习框架?
  • 手写双向链表LinkedList的几个常用功能
  • 再谈express与koa的对比
  • 400多位云计算专家和开发者,加入了同一个组织 ...
  • ​LeetCode解法汇总2182. 构造限制重复的字符串
  • # 日期待t_最值得等的SUV奥迪Q9:空间比MPV还大,或搭4.0T,香
  • #git 撤消对文件的更改
  • #Linux(帮助手册)
  • #pragma data_seg 共享数据区(转)
  • (8)STL算法之替换
  • (C)一些题4
  • (Matalb分类预测)GA-BP遗传算法优化BP神经网络的多维分类预测
  • (pojstep1.3.1)1017(构造法模拟)
  • (论文阅读笔记)Network planning with deep reinforcement learning
  • (十八)devops持续集成开发——使用docker安装部署jenkins流水线服务
  • (数位dp) 算法竞赛入门到进阶 书本题集
  • (转)c++ std::pair 与 std::make
  • (转)用.Net的File控件上传文件的解决方案
  • ******之网络***——物理***
  • **python多态
  • .NET CF命令行调试器MDbg入门(一)
  • .net用HTML开发怎么调试,如何使用ASP.NET MVC在调试中查看控制器生成的html?
  • /使用匿名内部类来复写Handler当中的handlerMessage()方法
  • @RequestBody与@ResponseBody的使用