当前位置: 首页 > news >正文

Attention (注意力机制)

1. 背景:

          字面的意思:给你一些东西(看见一个美女:).....),你会注意什么?

          大数据的时代下,有太多的数据,我们又该如何选择重要的数据呢?

          Attention 诞生了,但是又该如何去做呢(i.e., 实现该机制呢)?

2. 如何实现注意力

         查询的对象Q, 被查询的对象V

以下是网友的说法(初次接触这方面的只是点, 保留帮助理解):

        1) Query,Key,Value的概念取自于信息检索系统,举个简单的搜索的例子来说。当你在某电商平台搜索某件商品(年轻女士冬季穿的红色薄款羽绒服)时,你在搜索引擎上输入的内容便是Query。然后搜索引擎根据Query为你匹配Key(例如商品的种类,颜色,描述等)。然后根据Query和Key的相似度得到匹配的内容(Value)。

        2)Q,K,V是三个矩阵。 是 X 输入与 Wq,Wk,Wv 点积的结果。 最开始Wq,Wk,Wv 是随机生成的, 后面通过训练 Wq,Wk,Wv 会不断调整,通过loss 函数进行。 Wq,Wk,Wv 就是需要训练的参数。

以下图来自(attention注意力机制到底是什么?Q,K,V指的谁,如何操作?什么是多头注意力?带你深入了解注意力机制,以及transformer中的QKV。_哔哩哔哩_bilibili)

相关文章:

  • 香橙派AIpro实测:YOLOv8便捷检测,算法速度与运行速度结合
  • 前后端分离:四种开发模式与实践指南
  • 微信小程序毕业设计-球馆预约系统项目开发实战(附源码+论文)
  • labview排错
  • 02-部署LVS-DR群集
  • React 打包时如何关闭源代码混淆
  • 图像的反转
  • K8s 集群(kubeadm) CA 证书过期解决方案
  • 【代码随想录_Day24】134. 加油站 135. 分发糖果 860. 柠檬水找零 406. 根据身高重建队列
  • 地理信息科学:生态保护的智慧经纬
  • 2024年 Java 面试八股文(20w字)
  • springcloud第4季 分布式事务seata作用服务搭建1
  • Linux上快速定位Java代码问题行
  • 云桌面运维工程师
  • 大数据------JavaWeb------JSP(完整知识点汇总)
  • 0x05 Python数据分析,Anaconda八斩刀
  • 345-反转字符串中的元音字母
  • C# 免费离线人脸识别 2.0 Demo
  • Hexo+码云+git快速搭建免费的静态Blog
  • java中具有继承关系的类及其对象初始化顺序
  • LintCode 31. partitionArray 数组划分
  • opencv python Meanshift 和 Camshift
  • Spring技术内幕笔记(2):Spring MVC 与 Web
  • SpriteKit 技巧之添加背景图片
  • 阿里中间件开源组件:Sentinel 0.2.0正式发布
  • 分类模型——Logistics Regression
  • 机器学习学习笔记一
  • 聊一聊前端的监控
  • 数据科学 第 3 章 11 字符串处理
  • 新手搭建网站的主要流程
  • 用 vue 组件自定义 v-model, 实现一个 Tab 组件。
  • 做一名精致的JavaScripter 01:JavaScript简介
  • Nginx惊现漏洞 百万网站面临“拖库”风险
  • 关于Android全面屏虚拟导航栏的适配总结
  • 通过调用文摘列表API获取文摘
  • 微龛半导体获数千万Pre-A轮融资,投资方为国中创投 ...
  • ​草莓熊python turtle绘图代码(玫瑰花版)附源代码
  • ​学习一下,什么是预包装食品?​
  • #define 用法
  • #LLM入门|Prompt#1.8_聊天机器人_Chatbot
  • #QT(TCP网络编程-服务端)
  • #ubuntu# #git# repository git config --global --add safe.directory
  • #我与Java虚拟机的故事#连载10: 如何在阿里、腾讯、百度、及字节跳动等公司面试中脱颖而出...
  • %@ page import=%的用法
  • (173)FPGA约束:单周期时序分析或默认时序分析
  • (草履虫都可以看懂的)PyQt子窗口向主窗口传递参数,主窗口接收子窗口信号、参数。
  • (层次遍历)104. 二叉树的最大深度
  • (第9篇)大数据的的超级应用——数据挖掘-推荐系统
  • (九)One-Wire总线-DS18B20
  • (论文阅读26/100)Weakly-supervised learning with convolutional neural networks
  • (原创)可支持最大高度的NestedScrollView
  • (转)c++ std::pair 与 std::make
  • .NET Core 2.1路线图
  • .net oracle 连接超时_Mysql连接数据库异常汇总【必收藏】
  • .NET编程C#线程之旅:十种开启线程的方式以及各自使用场景和优缺点