深度学习今年来经典模型优缺点总结,包括卷积、循环卷积、Transformer、LSTM、GANs等

news2024/10/7 14:28:01

文章目录

  • 1、卷积神经网络(Convolutional Neural Networks,CNN)
    • 1.1 优点
    • 1.2 缺点
    • 1.3 应用场景
    • 1.4 网络图
  • 2、循环神经网络(Recurrent Neural Networks,RNNs)
    • 2.1 优点
    • 2.2 缺点
    • 2.3 应用场景
    • 2.4 网络图
  • 3、长短时记忆网络(Long Short-Term Memory,LSTM)
    • 3.1 优点
    • 3.2 缺点
    • 3.3 应用场景
    • 3.4 网络图
  • 4、门控循环单元(Gated Recurrent Unit,GRU)
    • 4.1 优点
    • 4.2 缺点
    • 4.3 应用场景
    • 4.4 网络图
  • 5、自注意力模型(Transformer)
    • 5.1 优点
    • 5.2 缺点
    • 5.3 应用场景
    • 5.4 网络图
  • 6、生成对抗网络(Generative Adversarial Networks,GANs)
    • 6.1 优点
    • 6.2 缺点
    • 6.3 应用场景
    • 6.4 网络图

1、卷积神经网络(Convolutional Neural Networks,CNN)

1.1 优点

  • 可用于图像处理和计算机视觉领域任务,包括图像分类、人物检索、物体重识别、物体检测和图像分割。
  • 通过卷积层有效捕捉图像中的局部特征(这是跟 transformer 的区别,transformer 关注全局信息)。
  • 具有平移不变性。

1.2 缺点

  • 需要大规模的标记图像数据进行训练。
  • 在其他领域的任务上性能可能不如前馈神经网络。

1.3 应用场景

适用场景:图像分类、目标检测等。
案例:图像识别。将图像分类为不同的物体或场景。

1.4 网络图

《Gradient-based learning applied to document recognition》;LeNet-5
在这里插入图片描述

2、循环神经网络(Recurrent Neural Networks,RNNs)

2.1 优点

  • 适用于序列数据,如自然语言处理和时间序列分析。
  • 具有循环连接,可以处理不定长的序列数据。
  • 具有记忆能力,可以捕捉时间依赖性。

2.2 缺点

  • 梯度消失问题,导致长序列的性能下降。
  • 计算复杂性较高,不适用于大规模数据和深度网络。

2.3 应用场景

适用场景:序列建模、自然语言处理等。
案例:语音识别。将口头语言转换为文本。

2.4 网络图

《Recurrent Neural Networks》
在这里插入图片描述

3、长短时记忆网络(Long Short-Term Memory,LSTM)

3.1 优点

  • 解决了RNN的梯度消失问题。
  • 适用于长序列的建模。
  • 在自然语言处理等领域取得了显著的成功。

3.2 缺点

  • 计算复杂性较高。
  • 需要大量的数据来训练深层 LSTM 网络。

3.3 应用场景

适用场景:处理长序列和时间序列数据。
案例:股票价格预测。预测金融市场的趋势。

3.4 网络图

《Long Short-Term Memory networks》
在这里插入图片描述

4、门控循环单元(Gated Recurrent Unit,GRU)

4.1 优点

  • 类似于 LSTM,但参数较少,计算复杂性较低。
  • 在某些任务上性能与 LSTM 相媲美。

4.2 缺点

  • 对于某些复杂任务,性能可能不如LSTM。

4.3 应用场景

适用场景:用于序列数据处理,与 LSTM 类似。
案例:情感分析。分析文本中的情感。

4.4 网络图

在这里插入图片描述

5、自注意力模型(Transformer)

5.1 优点

  • 适用于自然语言处理和序列建模等任务。
  • 可并行化,计算效率高。
  • 在大规模数据和深度模型上表现出色。

5.2 缺点

  • 需要大规模的数据来训练。
  • 相对较新的模型,可能不适用于所有任务。

5.3 应用场景

适用场景:用于自然语言处理、机器翻译等。
案例:机器翻译。将一种语言的文本翻译为另一种语言。

5.4 网络图

《Attention is All you need》
在这里插入图片描述

6、生成对抗网络(Generative Adversarial Networks,GANs)

6.1 优点

  • 用于生成数据和图像,以及进行无监督学习。
  • 生成高质量的样本。
  • 在图像生成、风格迁移等领域取得了显著的成功。

6.2 缺点

  • 训练复杂性高,稳定性差,需要谨慎调整超参数。
  • 对于某些任务,可能存在模式崩溃问题。
  • 相较于最新的扩散模型,生成的质量和效果不具有竞争性,特定的生成数据可能存在一定的噪声。

6.3 应用场景

适用场景:用于生成图像、音频、文本等。
案例:图像生成。生成逼真的图像。

6.4 网络图

《Generative Adversarial Nets》
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1276518.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ZeroTier外网访问实验室Linux服务器

ZeroTier外网访问实验室Linux服务器 1、在ZeroTier上创建一个自己的Network 进入ZeroTier的官网https://www.zerotier.com/注册一个账号 注册完之后登录进去,创建自己的Network 创建完之后来到IPv4的分配管理,选择主机位只有后8位的IP,才能…

Windows安装Mysql Workbench及常用操作

Mysql Workbench是mysql自带的可视化操作界面,功能是强大的,但界面和navicat比,就是觉得别扭,但其实用惯了也还好,各有特色吧。这里记录一下常用的操作。 官方手册:MySQL Workbench 一、安装 1. 下载 官方…

C++可表示的数(数组前面2个数的和)

void 可表示的数&#xff08;数组前面2个数的和&#xff09;() {int aa[]{1,2,3,4,5,6,7,8,9}, j 0, z 1, jj z, n 9, ge 0;string a "";while (j < n)//缘由https://bbs.csdn.net/topics/396063706?page1#post-410898529{if (jj < n)if (aa[j] aa[z] …

深入浅出强化学习

目录 一、强化学习的概念 二、强化学习的特点 三、强化学习的训练过程 一、强化学习的概念 强化学习是一种机器学习方法&#xff0c;旨在教会算法如何通过与环境的交互来进行学习和决策。与传统的监督学习和无监督学习不同&#xff0c;强化学习侧重于学习与奖励和惩罚&#…

OSI七层模型的前三层

开发中我们常见的网络设计和网络排查等&#xff0c;用到的网络层一般是tcp/ip第四层&#xff0c;也称OSI 网络层&#xff0c;很少去关心前三层的网络层、数据链路层、物理层&#xff0c;脑海里想到这三层的数据流转&#xff0c;脑海里都是抽象的画面。 本篇浅显的梳理前三层中各…

spring boot 3.2.0 idea从零开始

spring boot 3.2.0 idea从零开始 最新的spring initilizer 不再支持低版本java&#xff0c;只能选择17、21 。 我也被迫尝试下最新版本的java。 jdk下载地址 自定义好artifact和group之后点击下一步。 在这里选择需要的组件&#xff0c;我准备做web项目所以只选择spring web …

Navicat Premium 16.3.3 Windows x64 Crack

增强您的表现。 Navicat 16 具有许多改进和功能&#xff0c;可以满足您的数据库开发需求。凭借 100 多项增强功能和全新界面&#xff0c;您可以探索构建、管理和维护数据库的新方法。构建时考虑到可用性。 Navicat 16 引入了许多 UI/UX 改进&#xff0c;以最大限度地提高您的效…

C++浅谈Actor模型及其应用

文章目录 0 引入1、理解1.1 为什么会出现Actor这种模型呢&#xff1f;1.2 Actor如何解决 2、应用1.SkyNet2.Erlang3.RabbitMQ 3、引用 0 引入 最近发现Actor模型其实我在工作中已经不知不觉实现了&#xff0c;最起码有这些影子。 1、理解 Actor模型是一种轻量级的并发编程模型…

Android--Jetpack--Lifecycle详解

富贵本无根&#xff0c;尽从勤里得 一&#xff0c;定义 Lifecycle 是一个具备宿主生命周期感知能力的组件。它持有组件&#xff08;Activity/Fragment&#xff09;生命周期状态信息&#xff0c;并且允许其观察者监听宿主生命周期状态变化。 顾名思义&#xff0c;Lifecycle的主…

[论文阅读]Sparse Fuse Dense

SFD Sparse Fuse Dense: Towards High Quality 3D Detection with Depth Completion 论文网址&#xff1a;SFD 论文代码&#xff1a;SFD 论文简读 本文主要关注如何利用深度完成技术提高三维目标检测的质量。论文提出了一种名为 SFD&#xff08;Sparse Fuse Dense&#xff0…

SQL server 2016安装

1、关系数据库的基本概念。 行&#xff1a;每行成为一条“记录”或“元组”&#xff0c;用于描述一个对象的信息。 列&#xff1a;每列称为一个“字段”或“属性”&#xff0c;用于描述对象的一个属性。 2、主键与外键。 主键&#xff1a;键&#xff0c;即关键字。主键由一个或…

CentOS或RHEL安装vscode

下载rpm安装包 网络下载或者下载到本地再上传到服务器&#xff0c;点击访问国内下载地址&#xff0c;不需要积分curl -fOL https://github.com/coder/code-server/releases/download/v4.19.1/code-server-4.19.1-amd64.rpm安装 rpm -i code-server-4.19.1-amd64.rpm关闭和禁用…

高端网站设计公司 -蓝蓝设计数据可视化大屏服务

UI设计公司-蓝蓝设计&#xff08;北京兰亭妙微科技有限公司&#xff09;是一支由清华美院毕业的专业团队组成的设计公司。我们的设计师们在大屏科研信息软件UI设计领域拥有多年的工作经验和丰富的行业知识。我们对设计充满热爱&#xff0c;设计不仅是我们的专业和职业&#xff…

locked1勒索病毒,刚攻击完海康威视系统,又再针对速达软件服务器攻击

导言&#xff1a; .locked、.locked1勒索病毒正成为数字安全的一大威胁。本文91数据恢复将深入介绍.locked、.locked1勒索病毒的特点、如何有效恢复被其加密的数据文件&#xff0c;以及预防这一数字噩梦的方法。如果您正在经历勒索病毒数据恢复的困境&#xff0c;我们愿意与您…

【动态规划】LeetCode-62.不同路径

&#x1f388;算法那些事专栏说明&#xff1a;这是一个记录刷题日常的专栏&#xff0c;每个文章标题前都会写明这道题使用的算法。专栏每日计划至少更新1道题目&#xff0c;在这立下Flag&#x1f6a9; &#x1f3e0;个人主页&#xff1a;Jammingpro &#x1f4d5;专栏链接&…

webGL开发学科演示项目方案

开发学科演示项目需要考虑到教育目标、互动性和用户体验。以下是一个可能的技术方案&#xff0c;可用于实现这样的项目&#xff0c;希望对大家有所帮助。北京木奇移动技术有限公司&#xff0c;专业的软件外包开发公司&#xff0c;欢迎交流合作。 1.WebGL 框架&#xff1a; 选择…

java企业财务管理系统springboot+jsp

1、基本内容 &#xff08;1&#xff09;搭建基础环境&#xff0c;下载JDK、开发工具eclipse/idea。 &#xff08;2&#xff09;通过HTML/CSS/JS搭建前端框架。 &#xff08;3&#xff09;下载MySql数据库&#xff0c;设计数据库表&#xff0c;用于存储系统数据。 &#xff08;4…

微信小程序自定义tabBar简易实现

文章目录 1.app.json设置custom为true开启自定义2.根目录创建自定义的tab文件3.app.js全局封装一个设置tabbar选中的方法4.在onshow中使用选中方法最终效果预览 1.app.json设置custom为true开启自定义 2.根目录创建自定义的tab文件 index.wxml <view class"tab-bar&quo…

Java零基础——vue篇

1.【熟悉】Vue简介 1.1 简介 它是一个构建用户界面的框架 Vue是一个前端框架 js jq https://www.pmdaniu.com/#file UI网站 UI 一般开发者使用蓝湖 工具 看着UI图 写接口 https://lanhuapp.com/web/#/item 是一个轻量级的MVVM&#xff08;Model-View-ViewModel&#xff0…

STM32学习笔记--闪存Flash

STM32F1系列的FLASH包含程序存储器、系统存储器和选项字节三个部分&#xff0c;通过闪存存储器接口&#xff08;外设&#xff09;可以对程序存储器和选项字节进行擦除和编程。 读写FLASH的用途&#xff1a;利用程序存储器的剩余空间来保存掉电不丢失的用户数据 &#xff0c;通过…