一文读懂「Self Attention」自注意力机制

一文读懂「Self Attention」自注意力机制

news2026/3/28 10:32:58

前言：Self-Attention是 Transformer 的重点，因此需要详细了解一下 Self-Attention 的内部逻辑。

一、什么是自注意力机制？

就上图为例，老实告诉我当你第一眼看到上图时，你的视线停留在哪个位置？对于我这种老二次元是在妹子身上，但是对于舰船迷来说，可能注意力就是在舰船上。同一张图片，不同的人观察注意到的可能是不同的地方，这就是人的注意力机制。attention 就是模仿人的注意力机制设计地。那么究竟是如何实现的呢？

二、自注意力机制结构

2.3 Self-Attention 结构

在这里插入图片描述
上图是 Self-Attention 的结构，在计算的时候需要用到矩阵Q(查询)，K(键值)，V(值)。在实际中，Self-Attention 接收的是输入(单词的表示向量x组成的矩阵X) 或者上一个 Encoder block 的输出。而Q，K，V正是通过 Self-Attention 的输入进行线性变换得到的。

2.2 Q, K, V 的计算

Self-Attention 的输入用矩阵X进行表示，则可以使用线性变阵矩阵WQ,WK,WV计算得到Q,K,V。计算如下图所示，注意 X, Q, K, V 的每一行都表示一个单词。
在这里插入图片描述

2.3 Self-Attention 的输出

得到矩阵 Q, K, V之后就可以计算出 Self-Attention 的输出了，计算的公式如下：
在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1366063.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

鸿蒙开发之如何查看界面层级

鸿蒙开发之如何查看界面层级

首先，需要是在真机或模拟器已经是run的状态。然后点击deveco studio 的 tools工具栏的ArkUl Inspector 然后界面下面显示出层级显示卡，但还看不到然后选择一下进程please select a process 就能显示了

阅读更多...

【Android Studio】创建第一个APP工程及生成APK安装包

【Android Studio】创建第一个APP工程及生成APK安装包

🌟博主领域：嵌入式领域&人工智能&软件开发前言：本文详细介绍创建Android Studio第一个APP工程及打包生成APK安装包。如下两个博客我记录了第一次创建项目时出现的问题，若你也遇见了同样的问题，可参考&#…

阅读更多...

vue简体繁体互转无需做字库

vue简体繁体互转无需做字库

第一种方法 vue-i18n 需要自己写字库库很麻烦,而且不支持后端传值第二种 opencc 这个库前端去使用的时候数据较多的情况非常慢.影响使用第三种 language-hk-loader npm i language-hk-loader 从其他博客中看到的一种,很方便不需要写字库,但是在打包的时候去整体的去翻译…

阅读更多...

基于深度学习的停车位关键点检测系统（代码+原理）

基于深度学习的停车位关键点检测系统（代码+原理）

摘要： DMPR-PS是一种基于深度学习的停车位检测系统，旨在实时监测和识别停车场中的停车位。该系统利用图像处理和分析技术，通过摄像头获取停车场的实时图像，并自动检测停车位的位置和状态。本文详细介绍了DMPR-PS系统的算法原理、…

阅读更多...

【Scala】——变量数据类型运算符

【Scala】——变量数据类型运算符

1. 概述 1.1 Scala 和 Java 关系 1.2 scala特点 Scala是一门以Java虚拟机（JVM）为运行环境并将面向对象和函数式编程的最佳特性结合在一起的静态类型编程语言（静态语言需要提前编译的如：Java、c、c等，动态语言如&#…

阅读更多...

vue3 响应式api中特殊的api

vue3 响应式api中特殊的api

系列文章目录 TypeScript 从入门到进阶专栏文章目录系列文章目录一、shallowRef()二、triggerRef()三、customRef()四、shallowReactive()五、shallowReadonly()六、toRaw()七、markRaw()八、effectScope()九、getCurrentScope() 一、shallowRef() shallowRef()是一个新的响…

阅读更多...

我是内网灵活的狗之渗透之红日靶场 stack之用户域渗透

我是内网灵活的狗之渗透之红日靶场 stack之用户域渗透

接上回我们现在准备对域内的用户靶机进行一下扫描因为对所有的端口进行扫描的话会导致扫描时间过长我们这里只对部分重要端口进行扫描看见445端接口开着，所以我们尝试连接445 的漏洞用永恒之蓝漏洞连接后，尝试用这个漏洞，添加新的用…

阅读更多...

代码随想录day22 二叉树开始进入无固定方法阶段

代码随想录day22 二叉树开始进入无固定方法阶段

235. 二叉搜索树的最近公共祖先题目给定一个二叉搜索树, 找到该树中两个指定节点的最近公共祖先。百度百科中最近公共祖先的定义为：“对于有根树 T 的两个结点 p、q，最近公共祖先表示为一个结点 x，满足 x 是 p、q 的祖先且 x 的深度尽可…

阅读更多...

小程序实现绘制图片保存到手机

小程序实现绘制图片保存到手机

HTML <template><view><canvas canvas-id"myCanvas" :style"{height:380px,width:wWidthpx,background:#FFFFFF}"></canvas><view class"textCenter"><button click"saveCanvas">保存图片</b…

阅读更多...

Python从入门到网络爬虫（读写Excel详解）

Python从入门到网络爬虫（读写Excel详解）

前言 Python操作Excel的模块有很多，并且各有优劣，不同模块支持的操作和文件类型也有不同。最常用的Excel处理库有xlrd、xlwt、xlutils、xlwings、openpyxl、pandas，下面是各个模块的支持情况： 工具名称.xls.xlsx获取文件内容写入…

阅读更多...

led恒流式驱动电源芯片一览表

led恒流式驱动电源芯片一览表

LED恒流式驱动电源芯片是一种用于驱动LED灯的关键组件。它能够稳定地提供恒定的电流，确保LED灯的亮度和颜色始终保持一致。 LED恒流式驱动电源芯片通常由电源管理单元、恒流输出部分和保护电路组成。电源管理单元负责转换输入电压为恒定的直流电压，并通…

阅读更多...

我是内网灵活的狗之stack靶场1

我是内网灵活的狗之stack靶场1

首先我们还是老样子我们先启动这个在win7上面的php工具，也就是启动php服务然后我们启动kali攻击机然后打开webshell工具然后我们先打开MSF工具进行监听启动msf工具进行监听 12345端口然后在文件中打开虚拟终端，连接到目标机器内部 start 620.exe…

阅读更多...

SpikingJelly笔记之泊松编码

SpikingJelly笔记之泊松编码

文章目录前言一、泊松编码的原理二、生成符合泊松分布的脉冲序列三、SpikingJelly中的泊松编码四、Lena图像的泊松编码与还原1.原始图像2.图像编码3.图像还原总结前言记录SpikingJelly中泊松编码的使用方法，对图像数据进行编码与还原一、泊松编码的原理基于…

阅读更多...

AI-数学-初中-1.1二次函数图像及顶点式

AI-数学-初中-1.1二次函数图像及顶点式

一元二次方程ax^2bxc0（a≠0）的根的判别式是b^2-4ac，用“Δ”表示(读做“delta”) 实数根就是指方程式的解为实数，实数根也经常被叫为实根。判别式Δb^2-4ac 若Δb^2-4ac＜0,二次方程无实数根若Δb^2-4ac0,二次方程有…

阅读更多...

dynamic_cast, RTTI，整理

dynamic_cast, RTTI，整理

主要是参考下图，了解内存布局，然后写个实例程序就差不多明白了，但是需要熟悉指针转换。 1) 只有多态类才有RTTI信息，dynamic_cast正是运用RTTI进行转换，属于运行时类型检查。 2) dynamic_cast判断两个指针是否能转换…

阅读更多...

【大数据】Spark学习笔记

【大数据】Spark学习笔记

初识Spark Spark和Hadoop HadoopSpark起源时间20052009起源地MapReduceUniversity of California Berkeley数据处理引擎BatchBatch编程模型MapReduceResilient distributed Datesets内存管理Disk BasedJVM Managed延迟高中吞吐量中高优化机制手动手动APILow levelhigh level流…

阅读更多...

【花艺电商】SpringBoot集成MyBatis-Plus、Swagger2、SpringSecurity、OAuth2等技术整合开发

【花艺电商】SpringBoot集成MyBatis-Plus、Swagger2、SpringSecurity、OAuth2等技术整合开发

目录一、功能介绍 1. 说明 2. 功能实现 3. 技术应用二、技术详述 1.MyBatis-Plus 主要体现项目应用 2.SpringSecurity 应用作用三、页面展示 1. 登入 2. 主页 3. 详情 4. 购物车 5. 订单 6. 沙箱支付每篇一获一、功能介绍 1. 说明这个项目主要使用了…

阅读更多...

SpringIOC之support模块FileSystemXmlApplicationContext

SpringIOC之support模块FileSystemXmlApplicationContext

博主介绍：✌全网粉丝5W，全栈开发工程师，从事多年软件开发，在大厂呆过。持有软件中级、六级等证书。可提供微服务项目搭建与毕业项目实战，博主也曾写过优秀论文，查重率极低，在这方面有丰富的经验…

阅读更多...

单向可控硅充电电路图

单向可控硅充电电路图

单向可控硅工作原理单向可控硅有阳极A、阴极K、控制极G三个电极，由四层半导体PNPN构成。单向可控硅有三个PN结，其内部结构与等效电路符号如图4-10所示。单相可控硅可等效看成一个PNP型三极管Vl和一个NPN型三极管V2组合而成，Vl基极和V2集电极…

阅读更多...

KPU特征识别

KPU特征识别

前面的颜色识别、二维码识别都是使用了一些简单的图像处理功能，而更高级的机器视觉就需要使用 KPU 。可以简单类别为计算机的 GPU （显卡），本质是实现高速的图像数据运算我们来简单介绍一下 K210 的 KPU 。 KPU 是 K21…

阅读更多...

推荐文章

最新文章