17 Transformer 的解码器（Decoders）——我要生成一个又一个单词

17 Transformer 的解码器（Decoders）——我要生成一个又一个单词

news2025/2/22 1:48:24

Transformer 编码器

编码器在干吗：词向量、图片向量，总而言之，编码器就是让计算机能够更合理地（不确定性的）认识人类世界客观存在的一些东西

Transformer 解码器

解码器会接收编码器生成的词向量，然后通过这个词向量去生成翻译的结果。

解码器的 Self-Attention 在编码已经生成的单词

假如目标词“我是一个学生”—》masked Self-Attention

训练阶段：目标词“我是一个学生”是已知的，然后 Self-Attention 是对“我是一个学生” 做计算

如果不做 masked，每次训练阶段，都会获得全部的信息

如果做 masked，Self-Attention 第一次对“我”做计算

Self-Attention 第二次对“我是”做计算

……

测试阶段：

目标词未知，假设目标词是“我是一个学生”（未知），Self-Attention 第一次对“我”做计算
第二次对“我是”做计算
……

而测试阶段，没生成一点，获得一点

生成词

Linear 层转换成词表的维度

softmax 得到最大词的概率

softmax 细话

单词表

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1120283.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Go并发编程之二

Go并发编程之二

一、前言前一篇 Go并发编程之一主要介绍了如何通过go语句启动协程（goroutine）以及协程调度的不确定性，这一篇我们重点来介绍一下协程中另外一个重要概念channel，记住第一句话： goroutine之间不是通过共享内存来通信…

阅读更多...

JUC高并发容器-CopyOnWriteArrayList

JUC高并发容器-CopyOnWriteArrayList

CopyOnWriteArrayList JUC高并发容器线程安全的同步容器类什么是高并发容器？CopyOnWriteArrayList JUC高并发容器线程安全的同步容器类 Java同步容器类通过Synchronized(内置锁)来实现同步的容器，比如Vector、HashTable以及SynchronizedList等容器。线…

阅读更多...

react封装一个简单的upload组件(待完善)

react封装一个简单的upload组件(待完善)

目录 react封装一个简单的upload组件component / uploadImg / uploadImg.jsx使用效果 react封装一个简单的upload组件 component / uploadImg / uploadImg.jsx import React, { useState } from react; import { LoadingOutlined, PlusOutlined } from ant-design/icons; imp…

阅读更多...

【源码】C/C++运动会计分系统期末设计源码

【源码】C/C++运动会计分系统期末设计源码

文章目录题目介绍功能源码效果展示带报告（内容） 题目介绍使用语言： 两个版本都会发： 版本1：C语言版本2： C 代码量： 500 题目介绍： 要求：初始化输入：N-参赛…

阅读更多...

C++ 中的模型预测路径积分 (MPPI) 控制

C++ 中的模型预测路径积分 (MPPI) 控制

一、说明模型预测路径积分控制（MPPI）是一种基于采样的模型预测控制算法。是MPC控制模型的延申和拓宽，要了解MPPI需要先理解MPC，参见文章：MPC预测控制概述和C 中的模型库-CSDN博客二、模型预测路径积分 (MPPI) 控制模…

阅读更多...

【小白专用23.10.22 已验证】windows 11 安装PHP8.2 +Apache2.4

【小白专用23.10.22 已验证】windows 11 安装PHP8.2 +Apache2.4

环境说明 windows:windows 11 x64apache: Apache/2.4.43php :php-8.2.11 一.php 1、PHP下载 PHP For Windows: Binaries and sources Releases 注意： 1.要下载Thread Safe，否则没有php8apache2_4.dll这个文件；如果使用Apache作为服务器…

阅读更多...

Casbin实战经验大揭秘：教育培训领域的创新实践和高效优化策略

Casbin实战经验大揭秘：教育培训领域的创新实践和高效优化策略

策略描述语言（论文） 摘要: 为了保护云资源的安全，防止数据泄露和非授权访问，必须对云平台的资源访问实施访问控制。然而，目前主流云平台通常采用自己的安全策略语言和访问控制机制，从而造成两个问题&#x…

阅读更多...

Jenkins简介及安装配置详解：开启持续集成之旅

Jenkins简介及安装配置详解：开启持续集成之旅

目录一、Jenkins介绍1.1 持续集成1.2 Jenkins持续集成的过程（传统方式与自动化部署） 二、环境搭建1、准备工作2、WEB发布服务器环境搭建3、SVN服务器环境搭建4、Jenkins环境搭建一、Jenkins介绍 Jenkins是一个开源的、用Java编写的持续集成和持续交付&…

阅读更多...

Defender Antivirus占用资源怎么禁止

Defender Antivirus占用资源怎么禁止

前言有时Defender Antivirus 突然磁盘IO很高。导致机器卡得很，开发代码很不方便，本文就介绍如何禁用这个服务。2f089809-2c6f-4fb7-86f5-8b5cbca8bd0d 操作下载Defender Control https://www.sordum.org/9480/defender-control-v2-1/ 这是当前的最…

阅读更多...

Adobe Photoshop 基本操作

Adobe Photoshop 基本操作

PS快捷键图层选择图层 Ctrl T：可以对图层的大小和位置进行调整填充图层 MAC: AltBackspace (前景) or CtrlBackspace (背景) WINDOWS: AltDelete (前景) or CtrlDelete (背景) 快速将图层填充为前景色或背景色平面化图层（盖印图层&#xff09…

阅读更多...

uniapp实现登录组件之外区域置灰并引导登录

uniapp实现登录组件之外区域置灰并引导登录

实现需求每个页面需要根据用户是否登录决定是否显示登陆组件,登录组件半屏底部显示,登录组件之外区域置灰,功能按钮点击之后引导提示登录.页面效果如下: 实现思路说明设置登录组件背景颜色为灰色,将页面分成登录区域(底部)和非登陆区域(上面灰色显示部分), 置灰区域添加…

阅读更多...

嵌入式学习笔记（61）位操作符

嵌入式学习笔记（61）位操作符

2.1.1.位与& (1)注意：位与符号是一个&，两个&&是逻辑与。 (2)真值表：1&00 1&11 0&00 0&10 (3)从真值表可以看出：位与操作的特点是，只有1和1位于结果为1，其余全是0. (4)…

阅读更多...

【Java】Java 17 新特性

【Java】Java 17 新特性

Java 17 新特性概览 1. Java 17 简介2. Java 17 新特性类型推断 - 新的 var 关键字垃圾回收器改进JEP 356 增强的伪随机数生成器（1）提供了一个新接口 RandomGenerator（2）提供了一个新类 RandomGeneratorFactory（3&…

阅读更多...

Flutter的Don‘t use ‘BuildContext‘s across async gaps警告解决方法

Flutter的Don‘t use ‘BuildContext‘s across async gaps警告解决方法

文章目录问题有问题的源码问题原因问题分析Context的含义BuildContext的作用特殊情况解决方法问题 Flutter开发中遇到Don’t use BuildContext’s across async gaps警告有问题的源码 if (await databaseHelper.isDataExist(task.title)) {showDialog(context: context,…

阅读更多...

在PowerBI中提取IFC文件中的数据

在PowerBI中提取IFC文件中的数据

推荐：用 NSDT编辑器快速搭建可编程3D场景在这篇文章中，我将逐步介绍从IFC文件中提取数据以创建 Shift IFC4PowerBI 函数的步骤。通过了解此工作流程，你能够更轻松地将 IFC 数据合并到自己的流程中。在本文中，我们将重点关注文…

阅读更多...

Reparameterization trick（重参数化技巧）

Reparameterization trick（重参数化技巧）

“Reparameterization trick”（重参数化技巧）是一种在训练生成模型中处理随机性潜在变量的方法，特别常见于变分自动编码器（VAE）等模型中。这个技巧的目的是使模型可微分（differentiable）&#x…

阅读更多...

【源码】C++坦克大战源码

【源码】C++坦克大战源码

文章目录题目介绍你收到的所有文件源码效果展示报告内容题目介绍代码量：1450 语言：C 你收到的所有文件其中一个是devc版本，也可以用visual stdio 运行。源码效果展示 typedef struct //这里的出现次序指的是一个AI_ta…

阅读更多...

使用CountdownLatch和线程池批量处理http请求，并处理响应数据

使用CountdownLatch和线程池批量处理http请求，并处理响应数据

背景和问题背景：最近项目的一个接口数据，需要去请求其他多个服务器的数据，然后统一返回； 问题点：如果遍历所有的服务器地址，然后串行请求就会出现请求时间过长，加入需要请求十个服务器&…

阅读更多...

Xray联动crawlergo自动扫描漏洞教程

Xray联动crawlergo自动扫描漏洞教程

xray和crawlergo联动 xray下载: https://github.com/chaitin/xray/releases crawlergo下载:360-crawlergo： github：https://github.com/Qianlitp/crawlergo/releases 联动脚本： github：https://github.com/timwhitez/crawlergo_x_…

阅读更多...

Qt扫盲-QColor 理论使用总结

Qt扫盲-QColor 理论使用总结

QColor 理论使用总结一、概述1. 构造函数2. 合法性校验3. 组成值检索二、整数与浮点精度三、Alpha-Blended Alpha混合图四、预定义颜色五、扩展的RGB颜色模型六、HSV颜色模型七、HSL颜色模型八、CMYK颜色模型一、概述 QColor 是Qt里面描绘颜色的一个属性类，这个…

阅读更多...

推荐文章

最新文章