AI学习记录 - 自注意力机制之权重矩阵和查询向量V矩阵的计算方式的补充

news2024/11/15 9:23:13

点个赞

如果我们熟悉自注意力的话,就会发现Q和K矩阵结合的时候,会有一个长度为句子长度的权重矩阵,假如有句子abc,求abc的注意力权重矩阵的话,那就是一个3*3的矩阵如下矩阵。

在这里插入图片描述

我们假设了句子长度为3,那么V矩阵肯定也是宽为3,因为有三个词汇痲,长度为n的矩阵,假设n为5,每一行都是一个词向量。如下图
在这里插入图片描述

直接使用矩阵乘法将这两个矩阵相乘即可,得到一个形状一样的矩阵,这就是新的abc词向量。为什么使用矩阵乘法相乘就可以了呢,意义在哪里?

权重和V矩阵(词向量矩阵)的关系

1、只有a的时候,没有词汇对a造成影响,所以其他是负无穷大,类似我们看文章,我们对当前词的判断,来源于当前词的前面的词的影响,不考虑当前词的后面的词。

在这里插入图片描述

2.a和b存在的时候,a和b共同组成一个综合的语义,那a对综合语义影响大,还是b对综合语义影响大吗,为什么不叫b的新词向量,叫a和b的综合词向量呢?我认为,b的原语义,受到a语义的影响,那么b原语义就会被减弱,实际上是a和b的共同结果形成的新词向量,如下。

在这里插入图片描述

3.a和b,c存在的时候,a和b,c共同组成一个综合的语义,那a对综合语义影响大,还是b对综合语义影响大,还是c对综合语义影响大,如下。

在这里插入图片描述

得到下图 3 * 5 矩阵

在这里插入图片描述

刚刚刚刚刚刚刚刚刚刚刚刚刚刚刚刚刚刚刚刚刚 好 矩阵乘法满足我们对于词汇权重和V词向量矩阵的算法定义。。。。。。。。。。。。。。。。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2039368.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

React+AntDesign做一个日历,Calendar自定义headerRender

话不多说,直接贴效果图😄 日历是用的AntDesign提供的Calendar组件,这个组件还是蛮强大的,可以自定义头部时间下拉;渲染每个时间段,或者重置时间段内容,玩的空间是很大的 直接贴代码 第一步:下载js-calendar-converter添加到项目中,用于获取节假日等信息,如果需求…

C语言程序设计-[19] 二维数组

1、二维数组的定义 2、二维数组的初始化 注1:存储方式:二维数组的存放方式为: 按行存放。可将二维数组的元素看成若干个特殊的一维数组。 注2:前面讲过,对于一维数组:数组名代表该数组的首地址,即数组名d表…

Vue3使用ECharts的曲线条形堆叠混合图

先上效果图 图表容器 <div id"leftChart" style"height: 28vh"></div> <div id"rightChart" style"height: 28vh"></div> 监听resize视图窗口大小&#xff0c;可以让chart图表自适应大小 const leftChart …

数学:容斥原理

容斥原理是什么 不要想滴太复杂&#xff0c;这是单纯的数学问题&#xff0c;不是什么计算机原理&#xff0c;非常的简单&#xff0c;先来一道题&#xff0c;一个班级&#xff0c;有舞蹈队、信息队、篮球队三个队&#xff0c;信息队的有17人&#xff0c;篮球队的13人&#xff0…

云开发能力上新:云开发云数据库支持数据模型能力,支持多种数据库,多端SDK,简化关联关系管理,自动生成CRUD代码,一键生成应用,支持基于AI数据分析!

快速上手介绍 1.登录云开发工作台&#xff08;可通过微信开发者IDE-云开发-云后台&#xff0c;或直接访问链接 https://tcb.cloud.tencent.com/cloud-admin?_tcbProviderIdmp 登录&#xff09;&#xff1b; 2.选择“数据管理”&#xff1b; 3.选择“新建模型”&#xff0c;…

【EMC专题】ESD抑制器简要介绍

在ESD保护器件中可以分为陶瓷基类型和半导体基类型。其中有一类陶瓷基类型,使用的机制是电极间放电方法的产品就是ESD抑制器。本文章简要介绍了ESD抑制器的特点、基本结构和特性。 ESD抑制器的特点 ESD抑制器是间隙型的ESD(静电放电 Electrostatic Discharge)对策保护元件,…

超级字符串技能:提升你的编码游戏

嘿嘿,uu们,今天咱们来详解字符函数与字符串函数,好啦,废话不多讲,开干&#xff01; 1.:字符分类函数 C语言中又一系列的函数是专门做字符分类的,也就是一个字符属于什么类型的字符的,这些函数的使用需要包含头文件ctype.h 这些函数的使用方法都十分类似,博主在这里就举两到三个…

JavaScript 条件

条件语句用于基于不同条件执行不同的动作。 条件语句 在您写代码时&#xff0c;经常会需要基于不同判断执行不同的动作。 您可以在代码中使用条件语句来实现这一点。 在 JavaScript 中&#xff0c;我们可使用如下条件语句&#xff1a; 使用 if 来规定要执行的代码块&#…

【智能流体力学】ANSYS Fluent流体仿真学习流程和Fluent模型方法概述

目录 一、学习流程二、Fluent模型概述与方法介绍1. **稳态与瞬态流动模型**2. **层流与湍流模型**3. **可压缩与不可压缩流动模型**4. **传热模型**5. **多相流模型**6. **燃烧与化学反应模型**7. **噪声分析模型**8. **流-固耦合(FSI)与电磁场-流体耦合**9. **二次开发功能*…

前端工程化-01.前后端分离开发

一.传统的开发模式——前后端混合开发 二.目前的开发模式——前后端分离开发 三.接口文档 接口指的是业务功能&#xff0c;一个业务功能就会定义一个接口文档

第八季完美童模至尊天王大使·魏堃明 梦想为帆,少年荣耀启航!

7月20-23日&#xff0c;2024第八季完美童模全球总决赛在青岛圆满落幕。在盛大的颁奖典礼上&#xff0c;一位才能出众的小少年——魏堃明迎来了他舞台生涯的璀璨时刻。当聚光灯汇聚成一片璀璨的海洋&#xff0c;魏堃明踏着自信的步伐步入会场&#xff0c;身披精心设计的金色翅膀…

经典算法题总结:十大排序算法,外部排序和Google排序简介

十大排序算法 就地性&#xff1a;顾名思义&#xff0c;原地排序通过在原数组上直接操作实现排序&#xff0c;无须借助额外的辅助数组&#xff0c;从而节省内存。通常情况下&#xff0c;原地排序的数据搬运操作较少&#xff0c;运行速度也更快。 稳定性&#xff1a;稳定排序在完…

搭建知识中台:让企业告别低效率

在当今这个信息爆炸、知识更新日新月异的时代&#xff0c;企业面临着前所未有的挑战与机遇。如何在浩瀚的信息海洋中高效筛选、整合并利用知识资源&#xff0c;成为决定企业竞争力的关键因素之一。因此&#xff0c;搭建知识中台&#xff0c;构建企业知识管理的核心枢纽&#xf…

【HBZ分享】Mysql的Explain的各字段含义

Explain各个字段的含义 id 对于 SELECT 语句&#xff0c;每个查询都会被分配一个唯一的ID表示查询的标识符&#xff0c;数字越大越先执行 select_type 表示查询类型或者子查询类型&#xff0c;使用不同的 select_type 来帮助评估查询性能&#xff0c;并确定可以采取哪些优化方法…

DC-4靶机渗透测试

一、靶机下载地址 https://www.vulnhub.com/entry/dc-4,313/ 二、信息收集 1、主机发现 # 使用命令 nmap 192.168.145.0/24 -sn | grep -B 2 "00:0C:29:43:49:A5" 2、端口扫描 # 使用命令 nmap 192.168.145.217 -p- -sV 3、指纹识别 # 使用命令 whatweb "…

低代码开发平台:技术概览、效率与质量的权衡及挑战与机遇

&#x1f493; 博客主页&#xff1a;倔强的石头的CSDN主页 &#x1f4dd;Gitee主页&#xff1a;倔强的石头的gitee主页 ⏩ 文章专栏&#xff1a;《热点时事》 期待您的关注 目录 一、技术概览 基本概念 主要特点 市场现状 主流平台优缺点分析 二、效率与质量的权衡 提高…

C++练习备忘录

1. 保留两位小数输出格式 #include <iostream> #include <iomanip> using namespace std; int main() {double S 0;S (15 25) * 20 / 2;cout << fixed << setprecision(2) << S;return 0; }2. 设置输出宽度 #include <iostream> #inclu…

花式表演无人机技术详解

花式表演无人机作为现代科技与艺术融合的典范&#xff0c;以其独特的飞行姿态、绚烂的灯光效果及精准的控制能力&#xff0c;在各类庆典、体育赛事、音乐会等合中展现出非凡的魅力。本文将从以下几个方面对花式表演无人机技术进行详细解析。 1. 三维建模与编程 在花式表演无人…

SpringBoot整合日志功能(slf4j+logback)详解

目录 一、日志门面与日志实现 1.1 什么是日志门面和日志实现&#xff1f; 1.2 为什么需要日志门面&#xff1f; 二、简介 三、日志格式 四、记录日志 4.1 使用日志工厂 4.2 使用Lombok的Slf4j注解 五、日志级别 5.1 日志级别介绍 5.2 配置日志级别 5.3 指定某个包下…

SpringBoot配置--Profile

目录 使用profile 的原因&#xff1f; proflie 的配置方式 多profile文件方式 profile 激活方式 1 配置文件 2 命令行参数 小结 使用profile 的原因&#xff1f; 用来完成不同环境下&#xff0c;配置动态切换功能的&#xff08;具体什么意思呢&#xff1f;假设你在A电脑…