当前位置: 首页 > news >正文

深度学习-批量与动量【Datawhale X 李宏毅苹果书 AI夏令营】

实际工程中使用批量和动量可以对抗鞍点或局部最小值。

批量:
在计算梯度的时候不会用所有数据计算损失。类比我们考试复习时,一个单元一个单元的知识点输入,所有单元都输入就是一整个轮回。而这一个单元用深度学习的术语来说就是批量(batch)。遍历所有批量就是一个回合(epoch)。

使用全批量的数据来更新参数的方法叫做批量梯度下降法(BGD),在下降的梯度上引入随机噪声,叫做随机梯度下降法(SGD)。
相对而言,大的批量更新比较稳定,小的批量梯度方向存在一定的噪声,有噪声的梯度反而可以帮助训练。
在这里插入图片描述
动量:
如果一个球从高处滚下来,由于惯性它会继续往前走,如果动量足够大,甚至可以翻越小坡继续走。这就是动量。简单些理解,在高处下落的球在滑落到局部最低的坡之后会继续往高处越,假如当前的高处有一个小坡,球还是可以越过这个小坡到达下一个最低点。
在这里插入图片描述
在这里插入图片描述

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • [Algorithm][综合训练][kotori和气球][体操队形][二叉树中的最大路径和]详细讲解
  • 软件设计原则之开闭原则
  • 【大数据】深入解析向量数据库Faiss:搭建与使用指南
  • Swift-UITableView列表动态设置高度,根据不同的内容长度,设置heightForRowAt
  • WHAT - 通过 react-use 源码学习 React
  • 电商数据分析的价值
  • 订单类业务创建自增编码
  • Tongweb8074+7049m4 安装TongFlowControl(by lqw)
  • 指针(三)
  • MySQL 数据库自动分区
  • 使用Python恢复Windows、Linux、MacOS回收站中的文件和目录
  • MinIO实战攻略:轻松构建私有云存储解决方案
  • streamlit+wordcloud使用pyinstaller打包遇到的一些坑
  • boost库容器之Circular Buffer功能介绍,及使用示例
  • 神经网络微调技术全解(04)-- Prompt Tuning-可训练提示(Learnable Prompts)
  • [译] React v16.8: 含有Hooks的版本
  • 「前端早读君006」移动开发必备:那些玩转H5的小技巧
  • 【许晓笛】 EOS 智能合约案例解析(3)
  • 3.7、@ResponseBody 和 @RestController
  • Computed property XXX was assigned to but it has no setter
  • Laravel Mix运行时关于es2015报错解决方案
  • maya建模与骨骼动画快速实现人工鱼
  • MobX
  • python docx文档转html页面
  • Python 基础起步 (十) 什么叫函数?
  • Sequelize 中文文档 v4 - Getting started - 入门
  • Spring Boot MyBatis配置多种数据库
  • 计算机在识别图像时“看到”了什么?
  • 区块链将重新定义世界
  • 使用Tinker来调试Laravel应用程序的数据以及使用Tinker一些总结
  • 手写双向链表LinkedList的几个常用功能
  • Java数据解析之JSON
  • UI设计初学者应该如何入门?
  • ​Distil-Whisper:比Whisper快6倍,体积小50%的语音识别模型
  • ​Java基础复习笔记 第16章:网络编程
  • (4)Elastix图像配准:3D图像
  • (C#)Windows Shell 外壳编程系列9 - QueryInfo 扩展提示
  • (done) NLP “bag-of-words“ 方法 (带有二元分类和多元分类两个例子)词袋模型、BoW
  • (env: Windows,mp,1.06.2308310; lib: 3.2.4) uniapp微信小程序
  • (代码示例)使用setTimeout来延迟加载JS脚本文件
  • (二)Eureka服务搭建,服务注册,服务发现
  • (二)斐波那契Fabonacci函数
  • (仿QQ聊天消息列表加载)wp7 listbox 列表项逐一加载的一种实现方式,以及加入渐显动画...
  • (附源码)springboot电竞专题网站 毕业设计 641314
  • (四十一)大数据实战——spark的yarn模式生产环境部署
  • (学习日记)2024.04.10:UCOSIII第三十八节:事件实验
  • (转)Oracle 9i 数据库设计指引全集(1)
  • **PyTorch月学习计划 - 第一周;第6-7天: 自动梯度(Autograd)**
  • *算法训练(leetcode)第四十七天 | 并查集理论基础、107. 寻找存在的路径
  • ./configure,make,make install的作用(转)
  • .ai域名是什么后缀?
  • .net core 的缓存方案
  • .NET 中让 Task 支持带超时的异步等待
  • .NET编程——利用C#调用海康机器人工业相机SDK实现回调取图与软触发取图【含免费源码】
  • .NET开发人员必知的八个网站