当前位置: 首页 > news >正文

self_attention python代码

self_attention面试code

from math import sqrt
import torch
import torch.nn as nnclass SA(nn.Module):def __init__(self, dimQ, dimK, dimV):super(SA, self).__init__()self.dimQ = dimQself.dimK = dimKself.dimV = dimV# self.mid = 10self.linerQ = nn.Linear(self.dimQ, self.dimV, bias = False)self.linerK = nn.Linear(self.dimK, self.dimV, bias = False)self.linerV = nn.Linear(self.dimV, self.dimV, bias = False)self.sqrtD = 1 / sqrt(dimQ)def forward(self, x):batch, n, dim = x.shapeassert(dim == self.dimQ)Q = self.linerQ(x)K = self.linerK(x)V = self.linerV(x)dist = torch.bmm(Q, K.transpose(1, 2)) * self.sqrtDW = torch.softmax(dist, dim = -1)Output = torch.bmm(W, V)return Outputif __name__ == "__main__":x = torch.tensor([[[1,2,3],[2,3,4],[3,4,5],[4,5,6]],[[1,2,3],[2,3,4],[3,4,5],[4,5,6]]], dtype = torch.float)print(x.shape)saModel = SA(3, 3, 3)Output = saModel(x)print(Output)

https://zhuanlan.zhihu.com/p/338817680
https://blog.csdn.net/weixin_44750512/article/details/124244915
https://blog.csdn.net/qq_40178291/article/details/100302375

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 超高精电容传感器PCAP01调试+LABVIEW数据可视化调试手记
  • 分析Profiler Timeline中的算子序列,通过寻找频繁项集的办法,得到TOPK可融合的算子序列
  • 12、matlab中for循环,if else判断语句,break和continue用法以及switch case语句使用
  • ORA-12537: TNS:连接关闭/Io 异常: Got minus one from a read call
  • Open3D SVD算法实现对应点集配准
  • CountDownLatch 是 Java 中的一个同步辅助工具类
  • 线程池工具类
  • IT专业高考假期入门指南
  • 大数据期末复习——hadoop、hive等基础知识
  • C++进阶:继承和多态
  • CSS原子化
  • 2024年7月1日,公布的OpenSSH的漏洞【CVE-2024-6387】
  • 刷算法Leetcode---9(二叉树篇Ⅲ)
  • Vue.js 中属性绑定的详细解析:冒号 `:` 和非冒号的区别
  • 1125 子串与子列
  • 【Redis学习笔记】2018-06-28 redis命令源码学习1
  • 【每日笔记】【Go学习笔记】2019-01-10 codis proxy处理流程
  • export和import的用法总结
  • HashMap ConcurrentHashMap
  • JS变量作用域
  • JS函数式编程 数组部分风格 ES6版
  • node 版本过低
  • Solarized Scheme
  • vue的全局变量和全局拦截请求器
  • 案例分享〡三拾众筹持续交付开发流程支撑创新业务
  • 近期前端发展计划
  • 使用docker-compose进行多节点部署
  • 提升用户体验的利器——使用Vue-Occupy实现占位效果
  • 小程序、APP Store 需要的 SSL 证书是个什么东西?
  • 一道闭包题引发的思考
  • 在weex里面使用chart图表
  • ​力扣解法汇总1802. 有界数组中指定下标处的最大值
  • #07【面试问题整理】嵌入式软件工程师
  • #java学习笔记(面向对象)----(未完结)
  • #我与Java虚拟机的故事#连载05:Java虚拟机的修炼之道
  • #预处理和函数的对比以及条件编译
  • (STM32笔记)九、RCC时钟树与时钟 第一部分
  • (层次遍历)104. 二叉树的最大深度
  • (二)正点原子I.MX6ULL u-boot移植
  • (附源码)计算机毕业设计高校学生选课系统
  • (每日持续更新)jdk api之FileFilter基础、应用、实战
  • (免费领源码)python#django#mysql校园校园宿舍管理系统84831-计算机毕业设计项目选题推荐
  • (三)终结任务
  • (十七)devops持续集成开发——使用jenkins流水线pipeline方式发布一个微服务项目
  • (转)关于多人操作数据的处理策略
  • .NET C# 使用GDAL读取FileGDB要素类
  • .net core 使用js,.net core 使用javascript,在.net core项目中怎么使用javascript
  • .NET Framework与.NET Framework SDK有什么不同?
  • .NET 设计模式—适配器模式(Adapter Pattern)
  • .net(C#)中String.Format如何使用
  • .NET/C# 编译期能确定的字符串会在字符串暂存池中不会被 GC 垃圾回收掉
  • @Autowired 和 @Resource 区别的补充说明与示例
  • [ IOS ] iOS-控制器View的创建和生命周期
  • [000-01-022].第03节:RabbitMQ环境搭建
  • [2023-年度总结]凡是过往,皆为序章