当前位置: 首页 > news >正文

跟李沐学AI:自注意力和位置编码

自注意力

自注意力机制(Self-Attention Mechanism),也被称为内部注意力(Intra-attention)或并行注意力(Parallel Attention),是一种在深度学习模型中用于处理序列数据的机制。它允许模型在处理序列中的某个位置时,可以参考序列中所有其他位置的信息,从而捕捉到序列内部不同位置之间的依赖关系。

自注意力机制则是让序列自己对自己做注意力,即在同一个序列内进行信息交互,这样可以在单个序列内部建立更复杂的关联。

自注意力机制特别适合于需要理解长距离依赖的任务,因为它能有效地捕获序列内部的关系,而且随着序列长度的增加,其计算复杂度不会线性增长。

位置编码

与CNN/RNN不同,自注意力没有记录位置信息,而这些信息对于许多任务(尤其是自然语言处理任务)来说是非常重要的。因此,需要在编码中加入位置信息。位置编码可以通过学习得到也可以直接固定得到。接下来描述的是基于正弦函数和余弦函数的固定位置编码。

假设长度为n的序列是X\epsilon R^{nxd},那么使用位置编码矩阵P\epsilon R^{nxd}来输出X+P作为自编码输入。P的元素如下计算:

总结

自注意力机制中,query、key、value均来自同一输入。

卷积神经网络和自注意力都拥有并行计算的优势。自注意力的最大路径长度最短,但是因为其计算复杂度是关于序列长度的二次方,所以在很长的序列中计算会非常慢。

为了使用序列的顺序信息,可以通过在输入表示中添加位置编码,来注入绝对或者相对的位置嘻信息。 

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 典型的MVC设计模式:使用JSP和JavaBean相结合的方式来动态生成网页内容典型的MVC设计模式
  • 如何实现全行业证照一站式结构化识别?Textln企业资质证照识别上线!
  • kafka 消费者线程安全问题详细探讨
  • 中台架构下的数据仓库与非结构化数据整合
  • 详解前驱图与PV操作
  • R语言中的shiny框架
  • 《AI设计类工具系列之一——FigJam AI》
  • 邀请功能的实现分析
  • 初识C语言(三)
  • 嵌入式开发中学习C++的用处?
  • 拼图缺口形状检测系统源码分享
  • 解锁电商新视界:京东商品详情API——您的深度商品信息探索利器
  • Javax Validation 自定义注解校验(身份证号校验)
  • 线程池的执行流程和配置参数总结
  • np.array_fancy_indexing花式索引
  • Angular4 模板式表单用法以及验证
  • angular组件开发
  • CSS魔法堂:Absolute Positioning就这个样
  • el-input获取焦点 input输入框为空时高亮 el-input值非法时
  • HashMap剖析之内部结构
  • If…else
  • Java知识点总结(JavaIO-打印流)
  • leetcode386. Lexicographical Numbers
  • Mysql优化
  • node和express搭建代理服务器(源码)
  • Python 反序列化安全问题(二)
  • spring + angular 实现导出excel
  • Spring技术内幕笔记(2):Spring MVC 与 Web
  • Vue 动态创建 component
  • 猴子数据域名防封接口降低小说被封的风险
  • 基于 Ueditor 的现代化编辑器 Neditor 1.5.4 发布
  • 精彩代码 vue.js
  • 那些年我们用过的显示性能指标
  • 前端面试题总结
  • 前端性能优化--懒加载和预加载
  • 区块链分支循环
  • 算法-插入排序
  • 腾讯优测优分享 | Android碎片化问题小结——关于闪光灯的那些事儿
  • 写代码的正确姿势
  • 2017年360最后一道编程题
  • 继 XDL 之后,阿里妈妈开源大规模分布式图表征学习框架 Euler ...
  • ​【原创】基于SSM的酒店预约管理系统(酒店管理系统毕业设计)
  • ​软考-高级-信息系统项目管理师教程 第四版【第23章-组织通用管理-思维导图】​
  • ‌Excel VBA进行间比法设计
  • #大学#套接字
  • (ISPRS,2023)深度语义-视觉对齐用于zero-shot遥感图像场景分类
  • (待修改)PyG安装步骤
  • (附源码)springboot 个人网页的网站 毕业设计031623
  • (每日持续更新)jdk api之FileFilter基础、应用、实战
  • (每日持续更新)信息系统项目管理(第四版)(高级项目管理)考试重点整理第3章 信息系统治理(一)
  • (排序详解之 堆排序)
  • (淘宝无限适配)手机端rem布局详解(转载非原创)
  • (原)Matlab的svmtrain和svmclassify
  • (转)C语言家族扩展收藏 (转)C语言家族扩展
  • (转)微软牛津计划介绍——屌爆了的自然数据处理解决方案(人脸/语音识别,计算机视觉与语言理解)...