当前位置: 首页 > news >正文

深度学习中常用参数解释

1. 梯度下降

梯度下降几乎可以用于优化所有的深度学习模型,最简单的理解是计算损失函数关于模型参数的导数(梯度),然后通过不断地在损失函数递减的方向更新参数,即将梯度乘以一个预先确定的正数𝜂,并从当前参数的值中减掉,降低损失。

2. 小批量B

在每次迭代中,一般会随机抽样一个小批量B, 它是由固定数量的训练样本组成的。 然后,计算小批量的平均损失关于模型参数的导数。 |B|表示每个小批量中的样本数,这也称为批量大小(batch size)

3. 小批量随机梯度下降

通常会在每次需要计算更新的时候随机抽取一小批样本,并根据梯度下降方法,更新参数, 这叫做小批量随机梯度下降(minibatch stochastic gradient descent)。

 4. 学习率

  𝜂一般表示学习率(learning rate)。用于更新学习参数。

5. 超参数

批量大小和学习率的值通常是手动预先指定,而不是通过模型训练得到的。 这些可以调整但不在训练过程中更新的参数称为超参数(hyperparameter)。设置超参数很棘手,需要通过反复试验进行调整。

调参(hyperparameter tuning)是选择超参数的过程。 超参数通常是根据训练迭代结果来调整的, 而训练迭代结果是在独立的验证数据集(validation dataset)上评估得到的。

6. 泛化

在从未见过的数据上实现较低的损失, 这一过程被称为泛化(generalization)。可以体现模型的适用性。

7. 预测(prediction)或推断(inference)

给定特征估计目标的过程通常称为预测(prediction)或推断(inference)。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • ADE7953ACPZ-RL带零线电流测量的单相多功能计量IC 高精度与功能特性概览
  • 车载T-Box通信稳定性弱网测试方案
  • transforms
  • C语言-指针
  • 【数学分析笔记】第2章第3节无穷大量(1)
  • PMP核心知识点—之项目管理基础
  • vue3+ts+vant4 列表下拉刷新+分页加载
  • C学习(数据结构)--> 实现顺序结构二叉树
  • 使用maven快速生成打包文件2
  • EmguCV学习笔记 C# 5.2 仿射变换
  • 从CSS注入到渗透未知网页
  • Nuxt学习_基础知识(二)
  • 开源模型应用落地-qwen2-7b-instruct-LoRA微调模型合并-Axolotl-单机单卡-V100(十)
  • 短剧视频推广连续多日遭受大量DDOS攻击,如何应对
  • 单片机驱动彩屏最简方案:单片机_RA8889最小开发板驱动控制TFT彩屏介绍(一)方案架构
  • [原]深入对比数据科学工具箱:Python和R 非结构化数据的结构化
  • gulp 教程
  • Java读取Properties文件的六种方法
  • jQuery(一)
  • Js基础知识(一) - 变量
  • NLPIR语义挖掘平台推动行业大数据应用服务
  • node入门
  • Shadow DOM 内部构造及如何构建独立组件
  • SpriteKit 技巧之添加背景图片
  • Vue UI框架库开发介绍
  • 从tcpdump抓包看TCP/IP协议
  • 给自己的博客网站加上酷炫的初音未来音乐游戏?
  • 数据仓库的几种建模方法
  • 最近的计划
  • Play Store发现SimBad恶意软件,1.5亿Android用户成受害者 ...
  • 阿里云ACE认证学习知识点梳理
  • 阿里云API、SDK和CLI应用实践方案
  • 翻译 | The Principles of OOD 面向对象设计原则
  • # Redis 入门到精通(九)-- 主从复制(1)
  • # 安徽锐锋科技IDMS系统简介
  • # 数论-逆元
  • #微信小程序:微信小程序常见的配置传旨
  • $.ajax()方法详解
  • (13)DroneCAN 适配器节点(一)
  • (24)(24.1) FPV和仿真的机载OSD(三)
  • (BFS)hdoj2377-Bus Pass
  • (delphi11最新学习资料) Object Pascal 学习笔记---第2章第五节(日期和时间)
  • (Matlab)基于蝙蝠算法实现电力系统经济调度
  • (vue)el-cascader级联选择器按勾选的顺序传值,摆脱层级约束
  • (创新)基于VMD-CNN-BiLSTM的电力负荷预测—代码+数据
  • (动态规划)5. 最长回文子串 java解决
  • (二)学习JVM —— 垃圾回收机制
  • (南京观海微电子)——I3C协议介绍
  • (四) 虚拟摄像头vivi体验
  • (四)进入MySQL 【事务】
  • (转)PlayerPrefs在Windows下存到哪里去了?
  • ***汇编语言 实验16 编写包含多个功能子程序的中断例程
  • .MSSQLSERVER 导入导出 命令集--堪称经典,值得借鉴!
  • .NET 程序如何获取图片的宽高(框架自带多种方法的不同性能)
  • .NET 使用 ILMerge 合并多个程序集,避免引入额外的依赖