深度学习架构(CNN、RNN、GAN、Transformers、编码器-解码器架构)的友好介绍。

news2025/1/22 12:46:56

一、说明

        本博客旨在对涉及卷积神经网络 (CNN)、递归神经网络 (RNN)、生成对抗网络 (GAN)、转换器和编码器-解码器架构的深度学习架构进行友好介绍。让我们开始吧!!

二、卷积神经网络 (CNN)

        卷积神经网络 (CNN) 是一种人工神经网络,旨在处理和分析具有网格状拓扑结构的数据,例如图像和视频。将 CNN 想象成一个多层过滤器,它处理图像以提取有意义的特征并做出预测。

        想象一下,你有一张手写数字的照片,你希望计算机能够识别这个数字。CNN 的工作原理是在图像上应用一系列滤镜,逐渐提取越来越复杂的特征。第一个过滤器检测简单的特征,如边缘和线条,而后面的过滤器检测更复杂的图案,如形状和数字。

        卷积神经网络

        CNN 的层可分为三种主要类型:卷积层、池化层和全连接层。

  1. 卷积层:这些层将过滤器(也称为内核)应用于图像。每个滤镜在图像上滑动,计算滤镜和它所覆盖的像素之间的点积。此过程将生成一个新的特征图,该特征图突出显示了图像中的特定模式。使用不同的滤镜多次重复该过程,创建一组捕获图像不同方面的特征图。
  2. 池化图层:池化图层对特征图执行下采样操作,在保留重要要素的同时减小数据的空间维度。这有助于降低计算复杂性并防止过拟合。最常见的池化类型是最大池化,它从一小块像素邻域中选择最大值。
  3. 全连接层:这些层类似于传统神经网络中的层。它们将一层中的每个神经元连接到下一层中的每个神经元。卷积层和池化层的输出被展平化并通过一个或多个完全连接的层,允许网络做出最终预测,例如识别图像中的数字。

        总之,CNN 是一种神经网络,旨在处理类似网格的数据,例如图像。它的工作原理是将一系列过滤器或内核应用于图像,逐渐提取更复杂的特征。然后,输出通过池化层传递,以减小空间维度并防止过拟合。最后,输出通过全连接层进行最终预测。

三、递归神经网络 (RNN)

        递归神经网络 (RNN) 是一种人工神经网络,旨在处理顺序数据,例如时间序列、语音和自然语言。将RNN想象成一条传送带,一次处理一个元素的信息,使其能够“记住”来自先前元素的信息,从而对下一个元素进行预测。

        想象一下,你有一个单词序列,你希望计算机生成序列中的下一个单词。RNN 的工作原理是处理序列中的每个单词,一次一个,并使用来自前一个单词的信息来预测下一个单词。

        RNN 的关键组件是循环连接,它允许信息从一个时间步流向下一个时间步。递归连接是神经元内的一种连接,它“记住”了前一个时间步的信息。

RNN系列

RNN 可分为三个主要部分:输入层、循环层和输出层。

  1. 输入层:输入层在每个时间步长接收信息,例如序列中的一个单词。
  2. 递归层:递归层处理来自输入层的信息,使用递归连接来“记住”以前时间步长中的信息。循环层包含一组神经元,每个神经元都与自身建立循环连接,并在当前时间步长与输入建立连接。
  3. 输出层:输出层根据循环层处理的信息生成预测。在生成序列中的下一个单词的情况下,输出层将预测最有可能跟随序列中前一个单词的单词。

        总之,RNN 是一种旨在处理顺序数据的神经网络。它的工作原理是一次处理一个元素的信息,使用循环连接来“记住”来自先前元素的信息。递归层允许网络处理整个序列,使其非常适合语言翻译、语音识别和时间序列预测等任务。

四、生成对抗网络 (GAN)

        生成对抗网络 (GAN) 是一种深度学习架构,它使用两个神经网络(一个生成器和一个鉴别器)来创建新的、真实的数据。将 GAN 想象成两个对立的艺术家,一个创作假艺术,另一个试图区分真假。

        GAN 的目标是在各个领域(例如图像、音频和文本)生成高质量、逼真的数据样本。生成器网络创建新样本,而鉴别器网络评估生成样本的真实性。这两个网络以对抗的方式同时进行训练,生成器试图产生更真实的样本,而鉴别器则在检测假货方面变得更好。

赣语

GAN的两个主要组成部分是:

  1. 发电机: 发电机网络负责创建新样本。它以随机噪声向量作为输入并生成输出样本,例如图像或句子。生成器经过训练,通过最小化损失函数来生成更真实的样本,该损失函数测量生成的样本与真实数据之间的差异。
  2. 鉴别器:鉴别器网络评估生成样本的真实性。它以样本作为输入并输出一个概率,指示样本是真的还是假的。鉴别器经过训练,通过最大化损失函数来区分真实样本和虚假样本,该损失函数测量真实样本和生成样本之间的概率差异。

        GAN的对抗性源于生成器和鉴别器之间的竞争。生成器试图生成更真实的样本来欺骗鉴别器,而鉴别器则试图提高其区分真实样本和假样本的能力。这个过程一直持续到生成器生成高质量、逼真的数据,这些数据不容易与真实数据区分开来。

        总之,GAN是一种深度学习架构,它使用两个神经网络(一个生成器和一个判别器)来创建新的、真实的数据。生成器创建新样本,鉴别器评估其真实性。这两个网络以对抗方式进行训练,生成器产生更真实的样本,鉴别器提高其检测假货的能力。GAN 在各个领域都有应用,例如图像和视频生成、音乐合成和文本到图像合成。

五、变形金刚

        Transformer 是一种神经网络架构,广泛用于自然语言处理 (NLP) 任务,例如翻译、文本分类和问答。它们在 2017 年由 Vaswani 等人发表的开创性论文“Attention Is All You Need”中介绍。

        将转换器想象成一种复杂的语言模型,它通过将文本分解成更小的部分并分析它们之间的关系来处理文本。然后,该模型可以对各种查询生成连贯且流畅的响应。

        变压器由几个重复模块组成,称为层。每层包含两个主要组件:

  1. 自注意力机制:自注意力机制允许模型分析输入文本不同部分之间的关系。它的工作原理是为输入序列中的每个单词分配一个权重,表明其与当前上下文的相关性。这使得模型能够专注于重要的单词,而淡化不太相关的单词的重要性。
  2. 前馈神经网络:前馈神经网络是处理自注意力机制输出的多层感知器。他们负责学习输入文本中单词之间的复杂关系。

        变压器

        转换器的关键创新是使用自注意力机制,它允许模型有效地处理长序列的文本,而无需昂贵的循环或卷积操作。这使得转换器在计算上高效且适用于各种 NLP 任务。

        简单来说,转换器是一种强大的神经网络架构,专为自然语言处理任务而设计。他们通过将文本分解成更小的部分并通过自我注意力机制分析它们之间的关系来处理文本。这允许模型对各种查询生成连贯且流畅的响应。

六、编码器-解码器体系结构

        编码器-解码器架构在自然语言处理 (NLP) 任务中很受欢迎。它们通常用于序列到序列问题,例如机器翻译,其目标是将一种语言(源)的输入文本转换为另一种语言(目标)的相应文本。

        想象一下,编码器-解码器架构就像一个翻译器,他听一个用外语说话的人,同时将其翻译成听众的母语。

        编码器-解码器架构

        该体系结构由两个主要组件组成:

  1. 编码器:编码器获取输入序列(源文本)并按顺序进行处理,生成紧凑的表示形式,通常称为“上下文向量”或“上下文嵌入”。此表示形式汇总了输入序列,并包含有关其语法、语义和上下文的信息。编码器可以是递归神经网络 (RNN) 或转换器,具体取决于特定任务和实现。
  2. 译码器:解码器获取编码器生成的上下文向量,并一次生成一个元素的输出序列(目标文本)。解码器通常是循环神经网络或转换器,类似于编码器。它通过根据前一个单词和上下文向量中包含的信息预测目标序列中的下一个单词来生成输出序列。

        在训练过程中,解码器接收真正的目标序列,其目标是预测序列中的下一个单词。在推理期间(当模型生成响应时),解码器接收到该点之前生成的文本,并使用它来预测下一个单词。

        总之,编码器-解码器架构是自然语言处理任务中的一种流行方法,特别是对于机器翻译等序列到序列问题。该体系结构由一个编码器和一个解码器组成,前者处理输入序列并生成紧凑的表示,后者基于此表示生成输出序列。这允许模型将一种语言的输入文本转换为另一种语言的相应文本。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1602586.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Dryad Girl Fawnia

一个可爱的Dryad Girl Fawnia的三维模型。她有ARKit混合形状,人形装备,多种颜色可供选择。她将是一个完美的角色,幻想或装扮游戏。 🔥 Dryad Girl | Fawnia 一个可爱的Dryad Girl Fawnia的三维模型。她有ARKit混合形状,人形装备,多种颜色可供选择。她将是一个完美的角色…

网络攻防演练:一场针锋相对的技术博弈与安全防护实践

随着ChatGPT5的即将上线,其安全防护能力面临更为严峻的考验。网络攻防演练作为检验系统安全性能、提升防御体系的关键环节,对于确保ChatGPT5的安全稳定运行具有重要意义。本文将深入探讨网络攻击与防守之间的动态关系,并提供在网络攻防演练中…

【Leetcode每日一题】 分治 - 颜色分类(难度⭐⭐)(57)

1. 题目解析 题目链接:75. 颜色分类 这个问题的理解其实相当简单,只需看一下示例,基本就能明白其含义了。 2.算法原理 算法思路解析 本算法采用三指针法,将数组划分为三个区域,分别用于存放值为0、1和2的元素。通过…

vivado 设置 VIO 核以执行测量、查看 VIO 核状态

设置 VIO 核以执行测量 您添加到自己的设计中的 VIO 核会显示在“硬件 (Hardware) ”窗口中的目标器件下。如果未显示这些 VIO 核 , 请右键 单击器件并选择“ Refresh Hardware ”。这样将重新扫描 FPGA 或 ACAP 并刷新“ Hardware ”窗口。 注释 &#xff…

【免费】基于SOE算法的多时段随机配电网重构方法

1 主要内容 该程序是完全复现《Switch Opening and Exchange Method for Stochastic Distribution Network Reconfiguration》,也是一个开源代码,网上有些人卖的还挺贵,本次免费分享给大家,代码主要做的是一个通过配电网重构获取…

“面包板”是什么?有啥用?

同学们大家好,今天我们继续学习杨欣的《电子设计从零开始》,这本书从基本原理出发,知识点遍及无线电通讯、仪器设计、三极管电路、集成电路、传感器、数字电路基础、单片机及应用实例,可以说是全面系统地介绍了电子设计所需的知识…

一种范围可调式测径仪 满足生产各规格检测!

摘要:范围可调式测径仪,满足各种外径尺寸的产品检测,囊括产线的所有规格,性价比更高的测径仪。 关键词:测径仪,范围可调测径仪,在线测径仪 引言 生产线中,各种外径尺寸的线材、棒材、管材都有生产&#xff…

【SAP NWDI】服务开启:SLD,CM,CMS(二)

一、启用System Landscape Directory 二、启用 NWDI using CMS

CAN的底层驱动

框架图 拆解链路模型 CAN子系统 can_controller Core 包含协议控制器和接收/发送移位寄存器。它可处理所有 ISO 11898-1: 2015 协议功能,并支持 11 位和 29 位标识符。

一、基础算法-快速排序

1.快速排序 快速排序主要利用了分治的思想,具体步骤为: step1 确定分界点,常用为q[left],q[right],q[mid],也可以是随机的 step2 调整区间,将比分界点小的放左边,大的放右边 step3 利用递归处理左右两端 …

嵌入式Linux串口通信

嵌入式板子就和普通用的单片机比如stm32开发板,51开发板差不多,他们的串口都很类似,都是直接连上然后在PC机器上用串口软件打开就好了。 我使用的嵌入式开发板上面有8个rs485串口,2个rs232串口以及一个网口,刚开始开发…

代码随想录算法训练营第三十七天| LeetCode 738.单调递增的数字、总结

一、LeetCode 738.单调递增的数字 题目链接/文章讲解/视频讲解:https://programmercarl.com/0738.%E5%8D%95%E8%B0%83%E9%80%92%E5%A2%9E%E7%9A%84%E6%95%B0%E5%AD%97.html 状态:已解决 1.思路 如何求得小于等于N的最大单调递增的整数?98&am…

<计算机网络自顶向下> 多路复用与解复用

多路复用/解复用 端口号区分进程到进程多路解复用工作原理 解复用作用:TCP或者UDP实体采用哪些信息,将报文段的数据部分交给正确的socket,从而交给正确的进程主机收到IP数据报 每个数据报有源IP地址和目标地址每个数据报承载一个传输层报文段…

C++从入门到精通——const与取地址重载

const与取地址重载 前言一、const正常用法const成员函数问题const对象可以调用非const成员函数吗非const对象可以调用const成员函数吗const成员函数内可以调用其它的非const成员函数吗非const成员函数内可以调用其它的const成员函数吗总结 二、取地址及const取地址操作符重载概…

PPTX与PPT文件有什么区别?这2个办公技巧一定要知道!

每一次点击鼠标,每一次敲击键盘,我们都在与各种软件进行互动。其中,PPTX 和 PPT 无疑是职场中最常见的两种办公文档格式。那么,你是否清楚 PPTX 和 PPT 这两者之间的区别呢? 或许你会说,这不过是文件后缀名…

通过抖音短视频获客 只需要六步

抖音是当前最受欢迎的短视频平台之一,拥有庞大的用户群体和强大的社交矩阵,已经成为企业打造品牌口碑和快速获客的一种有效方式。那么,如何利用抖音短视频快速获客,打造品牌口碑呢?小马识途营销顾问简要分析如下&#…

【已解决】html页面刷新后css样式消失

登录失败后显示主页面时样式消失&#xff0c;如&#xff1a; 原因&#xff1a;index的样式引入css前面没有加斜杠 解决办法&#xff1a;添加斜杠 <link th:href"{/asserts/css/bootstrap.min.css}" rel"stylesheet"><link th:href"{/a…

【Git教程】(十四)基于特性分支的开发 — 概述及使用要求,执行过程及其实现,替代方案 ~

Git教程 基于特性分支的开发 1️⃣ 概述2️⃣ 使用要求3️⃣ 执行过程及其实现3.1 创建特性分支3.2 在 master 分支上集成某一特性3.3 将 master 分支上所发生的修改传递给特性分支 4️⃣ 替代方案4.1 直接在部分交付后的合并版本上继续后续工作4.2 到发行版即将成型时再集成特…

AI实践与学习4_大模型之检索增强生成RAG实践

背景 针对AI解题业务场景&#xff0c;靠着ToT、CoT等提示词规则去引导模型的输出答案&#xff0c;一定程度相比Zero-shot解答质量更高&#xff08;正确率、格式&#xff09;等。但是针对某些测试CASE&#xff0c;LLM仍然不能输出期望的正确结果&#xff0c;将AI解题应用生产仍…

Python接口自动化 —— Web接口!

1.2.1 web接口的概念 这里用一个浏览器调试工具捕捉课程管理页面请求作为例子&#xff1a; 当请求页面时&#xff0c;服务器会返回资源&#xff0c;将协议看做是路的话&#xff0c;http可以看做高速公路&#xff0c;soap看做铁路传输的数据有html&#xff0c;css&#xff0…