当前位置: 首页 > news >正文

【Pytorch】torch.nn.init.xavier_uniform_()

目录

  • 简介
  • torch.nn.init.xavier_uniform_()
    • 语法
    • 作用
    • 举例
    • 参考
  • 结语

在这里插入图片描述

简介

Hello!
非常感谢您阅读海轰的文章,倘若文中有错误的地方,欢迎您指出~
 
ଘ(੭ˊᵕˋ)੭
昵称:海轰
标签:程序猿|C++选手|学生
简介:因C语言结识编程,随后转入计算机专业,获得过国家奖学金,有幸在竞赛中拿过一些国奖、省奖…已保研
学习经验:扎实基础 + 多做笔记 + 多敲代码 + 多思考 + 学好英语!
 
唯有努力💪
 
本文仅记录自己感兴趣的内容

torch.nn.init.xavier_uniform_()

语法

torch.nn.init.xavier_uniform_(tensor, gain=1.0)

作用

根据了解训练深度前馈神经网络的难度 - Glorot, X. & Bengio, Y. (2010) 中描述的方法

使用均匀分布 用值填充输入张量

结果张量将具有从 U ( − a , a ) \mathcal{U}(-a, a) U(a,a) 采样的值,其中

在这里插入图片描述
也称为Glorot初始化

在这里插入图片描述

举例

w = torch.empty(3, 5)
print('w : \n', w)

nn.init.xavier_uniform_(w, gain=nn.init.calculate_gain('relu'))
print('w : \n', w)

在这里插入图片描述


w = torch.Tensor([[1.0,2,3],[2.0,3,4]])
print('w : \n', w)

nn.init.xavier_uniform_(w, gain=nn.init.calculate_gain('relu'))
print('w : \n', w)

在这里插入图片描述

注:w不能为1维


为什么需要Xavier 初始化?

在这里插入图片描述

所以论文提出,在每一层网络保证输入和输出的方差相同

参考:https://blog.csdn.net/dss_dssssd/article/details/83959474

个人感觉使用Xavier的作用就是预防一些参数过大或过小的情况,再保证方差一样的情况下进行缩放,便于计算

参考

  • https://pytorch.org/docs/stable/nn.init.html
  • https://blog.csdn.net/dss_dssssd/article/details/83959474

结语

文章仅作为个人学习笔记记录,记录从0到1的一个过程

希望对您有一点点帮助,如有错误欢迎小伙伴指正

在这里插入图片描述

相关文章:

  • 数据结构学习笔记(一)----绪论
  • Swift中运算符相关内容
  • GJB 5000A与GJB 5000B区别
  • 复盘:手推LR(逻辑回归logistics regression),它和线性回归linear regression的区别是啥
  • Java并发 | 18.[锁机制] 轻量级锁(CAS+自旋锁)
  • 【Pytorch】torch.nn.Dropout()
  • 组件通信的方法
  • 【Pytorch】torch. matmul()
  • 【JVM笔记】类型转换字节码指令
  • 聚观早报 | 东方甄选与顺丰、京东合作;拼多多跨境电商平台上线
  • 如何创建并运行java线程呢?
  • dubbo安装跟部署
  • ESP8266-Arduino编程实例-QRE1113红外反射传感器
  • 【Django】REST_Framework框架——Mixin类和GenericAPIView中的视图子类源码解析
  • Springboot、Tomcat启动加载外部指定文件夹下的jar文件
  • canvas实际项目操作,包含:线条,圆形,扇形,图片绘制,图片圆角遮罩,矩形,弧形文字...
  • Codepen 每日精选(2018-3-25)
  • gops —— Go 程序诊断分析工具
  • JavaScript函数式编程(一)
  • Java深入 - 深入理解Java集合
  • JS创建对象模式及其对象原型链探究(一):Object模式
  • Netty 框架总结「ChannelHandler 及 EventLoop」
  • vue从创建到完整的饿了么(18)购物车详细信息的展示与删除
  • webgl (原生)基础入门指南【一】
  • 从 Android Sample ApiDemos 中学习 android.animation API 的用法
  • 搭建gitbook 和 访问权限认证
  • 回顾2016
  • 离散点最小(凸)包围边界查找
  • 前端技术周刊 2018-12-10:前端自动化测试
  • Python 之网络式编程
  • 数据库巡检项
  • ( 用例图)定义了系统的功能需求,它是从系统的外部看系统功能,并不描述系统内部对功能的具体实现
  • (2)nginx 安装、启停
  • (52)只出现一次的数字III
  • (附源码)apringboot计算机专业大学生就业指南 毕业设计061355
  • (七)Java对象在Hibernate持久化层的状态
  • (未解决)macOS matplotlib 中文是方框
  • (一)基于IDEA的JAVA基础10
  • (转) 深度模型优化性能 调参
  • (转)MVC3 类型“System.Web.Mvc.ModelClientValidationRule”同时存在
  • (转载)从 Java 代码到 Java 堆
  • .\OBJ\test1.axf: Error: L6230W: Ignoring --entry command. Cannot find argumen 'Reset_Handler'
  • .Net 高效开发之不可错过的实用工具
  • .net操作Excel出错解决
  • @cacheable 是否缓存成功_Spring Cache缓存注解
  • @FeignClient注解,fallback和fallbackFactory
  • [ solr入门 ] - 利用solrJ进行检索
  • [ai笔记9] openAI Sora技术文档引用文献汇总
  • [C#]C#学习笔记-CIL和动态程序集
  • [CLickhouse] 学习小计
  • [HarmonyOS]第一课:从简单的页面开始
  • [Hive] INSERT OVERWRITE DIRECTORY要注意的问题
  • [hive] 窗口函数 ROW_NUMBER()
  • [java后端研发]——文件上传与下载(2种方式)
  • [jQuery]div滚动条回到最底部