当前位置: 首页 > news >正文

LLM - 神经网络的训练过程

1. 对于回归问题,用损失函数来计算预测值和真实值的差异,一种常用的公式是如下图所示(Mean Square Error),如果损失函数的值越小说明神经网络学习越准确,所以神经网络训练目标是减小损失函数的值,

    

2. 对于分类问题,损失函数和上面不一样,这里使用交叉熵作为损失函数,神经网络训练目标是最小化交叉熵。

3. 最小化损失函数的方法(梯度下降法),即将优化步骤拆分成若干个步骤,每次对损失函数的值做小幅缩小,具体过程是对损失函数求该模型参数的梯度,每次迭代对向着梯度变化最快的方向前进一步(这样就可以计算出模型参数,并在此轮迭代后更新模型参数),这样就可以使损失函数值降低一点,每次前进一步的步长称为学习率。

4. 回归问题的梯度求解过程:输出是标量F(x), 输入是[x1,x2,...xn], 对输入求偏导,得到的向量是梯度。

    

     

5. 分类问题的梯度求解过程:输出是向量F(X),有多个输出,让每个输出对输入变量X[x1,x2,..xn]求微分,得到的jacobian矩阵是梯度

6. 求微分时的链式法则:

7.求微分实例:

8.在实际深度学习场景中,对每个参数梯度计算是通过反向传播算法实现的。

9.单个节点梯度的计算过程: downstream_gradient = upstream_gradient * local_gradient 这个公式在实际写算子时会用到。

相关文章:

  • C++实现简化版Qt的QObject(3):增加父子关系、属性系统
  • 遗漏知识点
  • 【全网最全ABC三题完整版】2024年APMCM第十四届亚太地区大学生数学建模竞赛(中文赛项)完整思路解析+代码+论文
  • 【Spring】DAO 和 Repository 的区别
  • 开发经验:go切片的继承
  • windows@资源管理器中的地址栏@访问共享文件夹的各种方法@管理共享文件夹
  • linux 内核打印log太多咋办?
  • 重载赋值运算符
  • antd vue a-select 下拉框模糊查询失效解决方法
  • Android 图像切换器:实现动态图像切换的关键技术与应用
  • SQLyog脚本无限试用重置脚本
  • 【数据结构】(6.2)堆的应用——Top-K问题(C语言)
  • redis学习(005 java客户端 RedisTemplate学习)
  • C#中PostgreSql操作类的设计
  • golang实现网卡流量监控
  • 【399天】跃迁之路——程序员高效学习方法论探索系列(实验阶段156-2018.03.11)...
  • 3.7、@ResponseBody 和 @RestController
  • extract-text-webpack-plugin用法
  • Git同步原始仓库到Fork仓库中
  • JavaScript 事件——“事件类型”中“HTML5事件”的注意要点
  • Java知识点总结(JavaIO-打印流)
  • JS创建对象模式及其对象原型链探究(一):Object模式
  • nginx(二):进阶配置介绍--rewrite用法,压缩,https虚拟主机等
  • October CMS - 快速入门 9 Images And Galleries
  • open-falcon 开发笔记(一):从零开始搭建虚拟服务器和监测环境
  • scala基础语法(二)
  • Vue 动态创建 component
  • 对JS继承的一点思考
  • 强力优化Rancher k8s中国区的使用体验
  • 容器服务kubernetes弹性伸缩高级用法
  • 三栏布局总结
  • 算法-图和图算法
  • 一起参Ember.js讨论、问答社区。
  • 看到一个关于网页设计的文章分享过来!大家看看!
  • 摩拜创始人胡玮炜也彻底离开了,共享单车行业还有未来吗? ...
  • ​云纳万物 · 数皆有言|2021 七牛云战略发布会启幕,邀您赴约
  • # Panda3d 碰撞检测系统介绍
  • # SpringBoot 如何让指定的Bean先加载
  • ###51单片机学习(1)-----单片机烧录软件的使用,以及如何建立一个工程项目
  • #我与Java虚拟机的故事#连载19:等我技术变强了,我会去看你的 ​
  • (1)Map集合 (2)异常机制 (3)File类 (4)I/O流
  • (4.10~4.16)
  • (LeetCode C++)盛最多水的容器
  • (ros//EnvironmentVariables)ros环境变量
  • (附源码)spring boot公选课在线选课系统 毕业设计 142011
  • (附源码)spring boot智能服药提醒app 毕业设计 102151
  • (最简单,详细,直接上手)uniapp/vue中英文多语言切换
  • .naturalWidth 和naturalHeight属性,
  • .Net 4.0并行库实用性演练
  • .NET C# 使用GDAL读取FileGDB要素类
  • .NET Core Web APi类库如何内嵌运行?
  • .NetCore部署微服务(二)
  • .NET企业级应用架构设计系列之技术选型
  • .Net小白的大学四年,内含面经
  • .net最好用的JSON类Newtonsoft.Json获取多级数据SelectToken