Transformer 架构 - 编码器 (Transformer Architecture

Transformer 架构 - 编码器 (Transformer Architecture - Encoder)

news2025/4/19 15:43:47

Transformer 编码器的结构相对直观：它由 N 个完全相同的编码器层 (Encoder Layer) 堆叠而成。

图1: Transformer 编码器整体结构示意图 (简化)

输入序列（例如，通过 embedding 层转换后的词向量）首先会加上位置编码，然后传入第一个编码器层。第一个编码器层的输出作为第二个编码器层的输入，以此类推，直到最后一个编码器层输出最终的编码表示。

这种堆叠结构允许模型在每一层逐步提取和精炼输入的特征，捕获不同抽象层次的依赖关系。

每个编码器层内部结构是相同的，它主要包含两个核心的子层：

每个子层后面都跟着一个 残差连接 和一个 层归一化 步骤。

图2: Transformer 编码器层内部结构示意图

下面我们分别详细介绍这两个核心组件。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2338071.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

Transformer 架构 - 编码器 (Transformer Architecture - Encoder)