当前位置: 首页 > news >正文

算法面经手撕系列(3)--手撕LayerNormlization

LayerNormlization

 在许多的语言模型如Bert里,虽然都是说做的LayerNormlization,但计算均值和方差只会沿着channel维度做,并不是沿着seq_L和channel维度一起做,参考:BERT用的LayerNorm可能不是你认为的那个Layer Norm
 LayerNormlization计算流程:

  1. init里初始化C_in大小的scale和shift向量
  2. 沿Channel维度计算均值和方差
  3. 归一化

代码

 LayerNorm(InstanceNorm)实现如下:

class LayerNormalization(nn.Module):def __init__(self,hidden_dim,eps=1e-6):super(LayerNormalization, self).__init__()self.eps=epsself.gamma=nn.Parameter(torch.ones(hidden_dim))self.beta=nn.Parameter(torch.zeros(hidden_dim))def forward(self,x):B,seq_L,C=x.shapemean=x.mean(dim=-1,keepdim=True)std=x.std(dim=-1,keepdim=True)out=(x-mean)/(std+self.eps)out=out*self.gamma+self.betareturn out
if __name__=="__main__":tensor_input=torch.rand(5,10,8)model=LayerNormalization(8)res=model(tensor_input)print(res)

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • Qt/C++ TCP调试助手V1.1 新增图像传输与接收功能(附发布版下载链接)
  • leetcode 437.路径总和III
  • FPGA基本结构和简单原理
  • docker|Oracle数据库|docker快速部署Oracle11g和数据库的持久化(可用于生产环境)
  • 如何免费调用GPT API进行自然语言处理
  • 力扣2563.统计公平数对的数目
  • 2024年9月第3周AI资讯
  • android10 系统定制:增加应用使用数据埋点,应用使用时长统计
  • 【uni-app】小兔鲜项目-基础架构-请求和上传文件拦截器
  • 大数据最新面试题(持续更新)
  • 语音识别与语音控制的原理介绍
  • C++的初阶模板和STL
  • 漫步者头戴式耳机怎么样?漫步者、西圣、索尼三大耳机测评对比
  • 1.3 MySql的用户管理
  • 基于STM32红外感应的自动迎客人语音控制系统设计
  • 【Leetcode】101. 对称二叉树
  • [译]如何构建服务器端web组件,为何要构建?
  • django开发-定时任务的使用
  • JavaSE小实践1:Java爬取斗图网站的所有表情包
  • js作用域和this的理解
  • Linux编程学习笔记 | Linux多线程学习[2] - 线程的同步
  • nodejs调试方法
  • orm2 中文文档 3.1 模型属性
  • Redis字符串类型内部编码剖析
  • spring boot 整合mybatis 无法输出sql的问题
  • Zsh 开发指南(第十四篇 文件读写)
  • 多线程事务回滚
  • 个人博客开发系列:评论功能之GitHub账号OAuth授权
  • 我从编程教室毕业
  • 我的zsh配置, 2019最新方案
  • 我有几个粽子,和一个故事
  • ​3ds Max插件CG MAGIC图形板块为您提升线条效率!
  • ​iOS实时查看App运行日志
  • #{}和${}的区别?
  • #Linux(帮助手册)
  • (06)金属布线——为半导体注入生命的连接
  • (2)关于RabbitMq 的 Topic Exchange 主题交换机
  • (delphi11最新学习资料) Object Pascal 学习笔记---第13章第1节 (全局数据、栈和堆)
  • (论文阅读11/100)Fast R-CNN
  • (每日持续更新)jdk api之FileReader基础、应用、实战
  • (十六)Flask之蓝图
  • (十五)Flask覆写wsgi_app函数实现自定义中间件
  • (五) 一起学 Unix 环境高级编程 (APUE) 之 进程环境
  • .NET Framework与.NET Framework SDK有什么不同?
  • .NET 快速重构概要1
  • .net 重复调用webservice_Java RMI 远程调用详解,优劣势说明
  • .NET/C# 检测电脑上安装的 .NET Framework 的版本
  • .secret勒索病毒数据恢复|金蝶、用友、管家婆、OA、速达、ERP等软件数据库恢复
  • ??Nginx实现会话保持_Nginx会话保持与Redis的结合_Nginx实现四层负载均衡
  • [ Socket学习 ] 第一章:网络基础知识
  • [.NET]桃源网络硬盘 v7.4
  • [2010-8-30]
  • [ACM独立出版] 2024年虚拟现实、图像和信号处理国际学术会议(VRISP 2024,8月2日-4)
  • [AHK] WinHttpRequest.5.1报错 0x80092004 找不到对象或属性
  • [Android] Binder 里的 Service 和 Interface 分别是什么