当前位置: 首页 > news >正文

AI学习记录 - 自注意力机制之权重矩阵和查询向量V矩阵的计算方式的补充

点个赞

如果我们熟悉自注意力的话,就会发现Q和K矩阵结合的时候,会有一个长度为句子长度的权重矩阵,假如有句子abc,求abc的注意力权重矩阵的话,那就是一个3*3的矩阵如下矩阵。

在这里插入图片描述

我们假设了句子长度为3,那么V矩阵肯定也是宽为3,因为有三个词汇痲,长度为n的矩阵,假设n为5,每一行都是一个词向量。如下图
在这里插入图片描述

直接使用矩阵乘法将这两个矩阵相乘即可,得到一个形状一样的矩阵,这就是新的abc词向量。为什么使用矩阵乘法相乘就可以了呢,意义在哪里?

权重和V矩阵(词向量矩阵)的关系

1、只有a的时候,没有词汇对a造成影响,所以其他是负无穷大,类似我们看文章,我们对当前词的判断,来源于当前词的前面的词的影响,不考虑当前词的后面的词。

在这里插入图片描述

2.a和b存在的时候,a和b共同组成一个综合的语义,那a对综合语义影响大,还是b对综合语义影响大吗,为什么不叫b的新词向量,叫a和b的综合词向量呢?我认为,b的原语义,受到a语义的影响,那么b原语义就会被减弱,实际上是a和b的共同结果形成的新词向量,如下。

在这里插入图片描述

3.a和b,c存在的时候,a和b,c共同组成一个综合的语义,那a对综合语义影响大,还是b对综合语义影响大,还是c对综合语义影响大,如下。

在这里插入图片描述

得到下图 3 * 5 矩阵

在这里插入图片描述

刚刚刚刚刚刚刚刚刚刚刚刚刚刚刚刚刚刚刚刚刚 好 矩阵乘法满足我们对于词汇权重和V词向量矩阵的算法定义。。。。。。。。。。。。。。。。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • RCE绕过练习
  • 工厂模式和策略模式区别以及使用
  • STM32第十二节(中级篇):串口通信(第二节)——串口固件库函数以及串口发送和接收代码讲解
  • Nginx与Tomcat的区别
  • 计算机网络部分基础知识
  • 安全无忧!Windows7全补丁旗舰版:集成所有补丁!
  • 【HBZ分享】MYSQL的联合索引 与 覆盖索引
  • 【二叉树进阶】--- 根据二叉树创建字符串
  • LabVIEW光纤水听器闭环系统
  • 数据库服务器运维最佳实践
  • record 关键字
  • 内核源码定制修改模块化技术总结
  • 线程的概念
  • 基于inotif的文件同步备份
  • 服务器是什么?怎么选择适合自己的服务器?
  • 【5+】跨webview多页面 触发事件(二)
  • Angular 4.x 动态创建组件
  • Angular6错误 Service: No provider for Renderer2
  • AzureCon上微软宣布了哪些容器相关的重磅消息
  • Dubbo 整合 Pinpoint 做分布式服务请求跟踪
  • extract-text-webpack-plugin用法
  • HTTP传输编码增加了传输量,只为解决这一个问题 | 实用 HTTP
  • HTTP中的ETag在移动客户端的应用
  • Java 最常见的 200+ 面试题:面试必备
  • Java教程_软件开发基础
  • 纯 javascript 半自动式下滑一定高度,导航栏固定
  • 扑朔迷离的属性和特性【彻底弄清】
  • 使用docker-compose进行多节点部署
  • 我的业余项目总结
  • 我建了一个叫Hello World的项目
  • 我是如何设计 Upload 上传组件的
  • 一、python与pycharm的安装
  • 用jQuery怎么做到前后端分离
  • ​LeetCode解法汇总2583. 二叉树中的第 K 大层和
  • ​RecSys 2022 | 面向人岗匹配的双向选择偏好建模
  • # 移动硬盘误操作制作为启动盘数据恢复问题
  • ## 1.3.Git命令
  • ###51单片机学习(2)-----如何通过C语言运用延时函数设计LED流水灯
  • #Linux(Source Insight安装及工程建立)
  • #我与Java虚拟机的故事#连载04:一本让自己没面子的书
  • #我与Java虚拟机的故事#连载19:等我技术变强了,我会去看你的 ​
  • #知识分享#笔记#学习方法
  • $jQuery 重写Alert样式方法
  • (1综述)从零开始的嵌入式图像图像处理(PI+QT+OpenCV)实战演练
  • (PHP)设置修改 Apache 文件根目录 (Document Root)(转帖)
  • (附源码)计算机毕业设计大学生兼职系统
  • (七)MySQL是如何将LRU链表的使用性能优化到极致的?
  • (生成器)yield与(迭代器)generator
  • (十二)springboot实战——SSE服务推送事件案例实现
  • **《Linux/Unix系统编程手册》读书笔记24章**
  • .net 怎么循环得到数组里的值_关于js数组
  • .NET开源全面方便的第三方登录组件集合 - MrHuo.OAuth
  • .NET命令行(CLI)常用命令
  • .Net组件程序设计之线程、并发管理(一)
  • .pop ----remove 删除