当前位置: 首页 > news >正文

优化算法与正则化

目录

一:优化问题

1.梯度消失和爆炸

2.局部最优

 3.指数加权平均

4.动量梯度下降法

 5.RMSProp算法

6.Adam算法

二:学习率衰减

三:标准化

 都看到这里了,点个赞呗!!!!!


一:优化问题

1.梯度消失和爆炸

在梯度函数上出现指数级递增或者递减的情况下分别称为梯度爆炸或者梯度消失

假设g(z)=z,对于目标输出:y=w^n*w^n-1*w^n-2......w^2W^1

对于w的值大于1的情况下,激活函数的值将以指数级递增

w的值小于一的情况下,激活函数的值将以指数级递减

在计算梯度时,根据不同情况梯度函数也会以指数级递增或递减,导致训练导数难度上升,梯度下降算法的步长会变得非常小,需要训练的时间将会非常长

2.局部最优

鞍点:是函数上的导数为零,但不是局部极值的点。通常导数为零的带你是图上所示的鞍点,而非局部最小值,减少损失的难度也来自误差曲面中的鞍点,而不是局部最低点

 

在训练较大的神经网络,存在大量参数,并且函数被定义在较高的维度空间时,困在极差的局部最优基本不会发生

鞍点附近的平稳段会使得学习非常缓慢,而这也是需要动量梯度下将法,RMSProp以及Adam优化算法能加速学习的原因,它能帮助尽早走出平稳段

 3.指数加权平均

指数加权平均是一种常用的序列数据处理方式,通常用在序列场景如金融序列分析,温度变化序列分析。

加入给定一个序列,例如一个城市一年中的每天的气温值,图中蓝色的点代表真实数据

那么气温变化可以理解问过程波动较大,异常较多。那么怎么平缓一些呢,着时候就要用到加权平均值了,如指数加权平均

这条红线就是就是指数加权后计算出来的,指数加权公式:

公式中&#

相关文章:

  • Tomcat服务详解
  • 我与Linux的爱恋:yum和vim以及gcc的使用
  • A题 农村公交与异构无人机协同配送优化
  • Rust:Restful API 服务程序开发详述
  • 【ShuQiHere】从残差思想到 ResNet:深度学习的突破性创新
  • 【Python系列】只更新非空的字段
  • 【阅读文献】一个使用大语言模型的端到端语音概要
  • 无法用 FileZilla 传送文件的解决方案
  • AIGC简化文件管理:Python自动重命名Word和PDF文件
  • 配置Microsoft Exchange接受域的详细指南
  • 【数据结构】排序算法系列——序言(附源码+图解)
  • Vue——Diff算法
  • 9.8通宵速通javascript
  • 图论(2)
  • 微信小程序uniappvue3版本-控制tabbar某一个的显示与隐藏
  • 《深入 React 技术栈》
  • 「面试题」如何实现一个圣杯布局?
  • flutter的key在widget list的作用以及必要性
  • Java基本数据类型之Number
  • Laravel 菜鸟晋级之路
  • node.js
  • PHP 程序员也能做的 Java 开发 30分钟使用 netty 轻松打造一个高性能 websocket 服务...
  • Python利用正则抓取网页内容保存到本地
  • Quartz实现数据同步 | 从0开始构建SpringCloud微服务(3)
  • Sequelize 中文文档 v4 - Getting started - 入门
  • Spring核心 Bean的高级装配
  • vue:响应原理
  • Wamp集成环境 添加PHP的新版本
  • Zepto.js源码学习之二
  • 包装类对象
  • 闭包--闭包作用之保存(一)
  • 测试开发系类之接口自动化测试
  • 欢迎参加第二届中国游戏开发者大会
  • 想写好前端,先练好内功
  • PostgreSQL之连接数修改
  • 长三角G60科创走廊智能驾驶产业联盟揭牌成立,近80家企业助力智能驾驶行业发展 ...
  • ​iOS安全加固方法及实现
  • ​secrets --- 生成管理密码的安全随机数​
  • ​软考-高级-系统架构设计师教程(清华第2版)【第20章 系统架构设计师论文写作要点(P717~728)-思维导图】​
  • #define与typedef区别
  • #HarmonyOS:软件安装window和mac预览Hello World
  • $(selector).each()和$.each()的区别
  • (2024,Vision-LSTM,ViL,xLSTM,ViT,ViM,双向扫描)xLSTM 作为通用视觉骨干
  • (C#)获取字符编码的类
  • (echarts)echarts使用时重新加载数据之前的数据存留在图上的问题
  • (ZT)薛涌:谈贫说富
  • (办公)springboot配置aop处理请求.
  • (博弈 sg入门)kiki's game -- hdu -- 2147
  • (分布式缓存)Redis分片集群
  • (附源码)ssm失物招领系统 毕业设计 182317
  • (六)c52学习之旅-独立按键
  • (转)Android学习系列(31)--App自动化之使用Ant编译项目多渠道打包
  • (转)关于pipe()的详细解析
  • *1 计算机基础和操作系统基础及几大协议
  • .Net多线程Threading相关详解