<深度学习初识>——《深度学习笔记》

news2025/1/16 11:31:49

深度学习笔记

一、人工智能简介

1.人工智能发展的重要时间节点

在这里插入图片描述

1.1人工智能孕育期

在这里插入图片描述

1.2人工智能诞生期

在这里插入图片描述

1.3人工智能第一次浪潮的发展

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.4人工智能的第一次寒冬

在这里插入图片描述

第一次寒冬主要面临的几个问题:
在这里插入图片描述

1.5人工智能第二次浪潮的发展

在这里插入图片描述

在这里插入图片描述

1.6人工智能的第二次寒冬

在这里插入图片描述

1.7人工智能第三次浪潮的发展

在这里插入图片描述
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.8人工智能技术发展的关键

在这里插入图片描述

2.人工智能应用领域

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

人工智能与就业:
在这里插入图片描述

3.人工智能研究方法

3.1人工智能概念相关

人工智能定义:
在这里插入图片描述

人工智能学习的目标:
在这里插入图片描述

人工智能涉及到的相关学科:
在这里插入图片描述

人工智能当前的关键技术:

在这里插入图片描述

3.2人工智能研究方法

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

二、深度学习崛起的背景

1.大数据时代来临

信息存储方式的演变:在这里插入图片描述

传统媒介时代:

在这里插入图片描述

数字媒介时代:
在这里插入图片描述

大数据时代的到来:

在这里插入图片描述
在这里插入图片描述

大数据与小数据对比:
在这里插入图片描述

数据集规模对比:
在这里插入图片描述

数据领域相关:
在这里插入图片描述

2.GPU计算平台发展

在这里插入图片描述

GPU发展历史:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

人工智能相关芯片与应用场景:
在这里插入图片描述

3.算法的持续积累

什么是深度学习?

在这里插入图片描述

深度学习与神经网络:
在这里插入图片描述

反向传播机制:

在这里插入图片描述

无监督预训练:
在这里插入图片描述

激活函数:
在这里插入图片描述

正则化技术:
在这里插入图片描述

ImageNet比赛中的算法:
在这里插入图片描述

产业界中的深度学习发展:
在这里插入图片描述

三、深度学习典型应用与研究方向

1.深度学习应用之计算机视觉

在这里插入图片描述

图像分类:
在这里插入图片描述

图像分割:
在这里插入图片描述

目标检测:

在这里插入图片描述

目标识别(文本特征):

在这里插入图片描述

目标识别(生物特征):
在这里插入图片描述

目标跟踪:
在这里插入图片描述

图像质量分析与美学评估:
在这里插入图片描述

图像降噪与修复:
在这里插入图片描述

图像增强:

在这里插入图片描述

图像去模糊与超分辨:
在这里插入图片描述

图像翻译与风格化:

在这里插入图片描述

图像生成:

在这里插入图片描述

三维重建(人脸人体):

在这里插入图片描述

三维重建(通用场景):
在这里插入图片描述

图像编辑(人脸人体):
在这里插入图片描述

图像编辑(通用场景):
在这里插入图片描述

视频处理:
在这里插入图片描述

2.深度学习应用之语音处理

在这里插入图片描述

语音分类:

在这里插入图片描述

音频指纹识别:

在这里插入图片描述

语音检索与唤醒:
在这里插入图片描述

语音识别:
在这里插入图片描述

声纹/说话人识别:
在这里插入图片描述

语音质量评测:

在这里插入图片描述

语音增强:
在这里插入图片描述

语音合成:

在这里插入图片描述

语音生成:

在这里插入图片描述

语音合成综合应用:

在这里插入图片描述

3.深度学习应用之自然语言处理

在这里插入图片描述

文本基本任务:
在这里插入图片描述

文本分类与聚类:

在这里插入图片描述

文章标签与摘要提取:
在这里插入图片描述

文本审核与舆情分析:
在这里插入图片描述

机器翻译:
在这里插入图片描述

阅读理解:

在这里插入图片描述

问答系统与聊天机器人:

在这里插入图片描述

搜索引擎:

在这里插入图片描述

知识图谱:
在这里插入图片描述

自然语言生成/文本生成:

在这里插入图片描述

自然语言处理与其他方向的融合:

在这里插入图片描述

4.深度学习应用之推荐系统

在这里插入图片描述

推荐系统的重要性:

在这里插入图片描述

用户画像:

在这里插入图片描述

推荐类型:

在这里插入图片描述

具体应用之广告推荐:

在这里插入图片描述

四、深度学习之神经网络

1.生物学基础与感知器

1.1神经网络的生物学背景

细胞的工作机制:
在这里插入图片描述

神经细胞的工作机制:

在这里插入图片描述
在这里插入图片描述

神经元学说:

在这里插入图片描述

1.2人工神经元与感知器

MP模型:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

单层感知器:
在这里插入图片描述

单层感知器与线性分类任务:

在这里插入图片描述

权重参数更新方法:
在这里插入图片描述

单层感知器求解:

在这里插入图片描述

单层感知器的缺陷:
在这里插入图片描述

2.多层感知器与神经网络

2.1多层感知器与反向传播

多层感知器:
在这里插入图片描述

多层感知器表达能力:
在这里插入图片描述

神经网络的优化:
在这里插入图片描述

BP神经网络前向与反向过程:

在这里插入图片描述

误差反向传播算法:
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

误差反向传播算法案例;

在这里插入图片描述

非前馈神经网络:

在这里插入图片描述

2.2神经网络的表达能力与局限性

表达能力:
在这里插入图片描述

局限性:
在这里插入图片描述
在这里插入图片描述

3.图神经网络基础

3.1图的应用

为什么需要研究图:
在这里插入图片描述

不同层级的图数据任务:

在这里插入图片描述

3.2图的表示

图的表示:

在这里插入图片描述

图的表示——矩阵表示:
在这里插入图片描述

图的表示——Laplacian矩阵表示:

在这里插入图片描述

3.3图神经网络

图傅里叶变换——频域:

在这里插入图片描述

图滤波器——空域:

在这里插入图片描述

图卷积:

在这里插入图片描述
在这里插入图片描述

什么是图神经网络(GCN):
在这里插入图片描述

图数据的特点:

在这里插入图片描述

图神经网络与CNN对比:
在这里插入图片描述

五、卷积神经网络

1.卷积神经网络发展背景与基本概念

1.1发展背景

视野机制——感受野(Receptive Field):
在这里插入图片描述

视觉机制——方向选择特性:

在这里插入图片描述

视觉机制总结:
在这里插入图片描述

计算机视觉学科诞生:

在这里插入图片描述

Neocognitron:

在这里插入图片描述

Cresceptron:

在这里插入图片描述

卷积神经网络与传统神经网络的学习原理对比:

在这里插入图片描述

1.2卷积神经网络的基本概念

什么是卷积:

在这里插入图片描述

(上面是卷积后的输出,下面是卷积前的输入)

基本概念——数字图像的表示:

RGBA是带透明度的通道表示。
在这里插入图片描述

基本概念——图片卷积:

在这里插入图片描述

基本概念——特征图:

在这里插入图片描述

基本概念——多通道卷积:
在这里插入图片描述

基本概念——填充:
在这里插入图片描述

基本概念——步长:
在这里插入图片描述

卷积结构单元——输入输出大小计算:

在这里插入图片描述

基本概念——池化:
在这里插入图片描述

基本概念——感受野:
在这里插入图片描述

卷积神经网络的重要思想——局部连接:

在这里插入图片描述

卷积神经网络的重要思想——权重共享:
在这里插入图片描述

典型卷积神经网络——LeNets5:

在这里插入图片描述

2.卷积神级网络的反向传播与典型卷积神经网络

2.1卷积神经网络的反向传播

误差反向传播算法(复习):
在这里插入图片描述

卷积神经网络误差反向传播:
在这里插入图片描述

卷积神经网络误差反向传播案例:

(注:这里是卷积,不是矩阵相乘的计算法则)
在这里插入图片描述

在这里插入图片描述

2.2典型卷积神经网络

LeNets系列:

在这里插入图片描述

LeNets5:
在这里插入图片描述

LeNets5工程技巧:

在这里插入图片描述
在这里插入图片描述

这些技巧与当时的背景和计算机结构有关系。

AlexNets:
在这里插入图片描述

AlexNets工程技巧:
在这里插入图片描述

六、循环神经网络(RNN)及其改进

1.循环神经网络(RNN)

卷积神经网络的局限性:

在这里插入图片描述

RNN模型:

在这里插入图片描述

RNN模型的表达:

在这里插入图片描述

RNN模型的优化:

在这里插入图片描述

2.门控时序网络

长短时记忆网络:
在这里插入图片描述

在这里插入图片描述

门控循环单元:
在这里插入图片描述

3.复杂循环神经网络

双向循环网络:

在这里插入图片描述

深度循环神经网络:
在这里插入图片描述

七、深度学习优化

1.深度学习优化之激活函数与参数初始化

1.1什么是激活函数

什么是激活(生物层面):

在这里插入图片描述

激活的简单案例:
在这里插入图片描述

神经网络中的激活函数:
在这里插入图片描述

1.2激活函数的发展

S激活函数(Sigmoid):
在这里插入图片描述

ReLU激活函数:
在这里插入图片描述

ReLU激活函数的改进:

在这里插入图片描述
在这里插入图片描述

近似ReLU激活函数:

在这里插入图片描述

Maxout激活函数:

在这里插入图片描述

自动搜索的激活函数:

在这里插入图片描述

1.3参数初始化

初始化与深度学习:

在这里插入图片描述

什么是好的参数初始化:

在这里插入图片描述

全零初始化与随机初始化:
在这里插入图片描述

标准初始化:
在这里插入图片描述

Xavier初始化:
在这里插入图片描述

MSRA初始化:

在这里插入图片描述

2.深度学习优化之标准化与池化

2.1标准化方法

什么是标准化/归一化:
在这里插入图片描述

归一化的作用:
在这里插入图片描述

Batch Normalization:

在这里插入图片描述

Batch Normalization的好处:

在这里插入图片描述

Batch Normalization的缺点与改进:

在这里插入图片描述

标准化方法的对比:
在这里插入图片描述

自动学习标准化方法:

在这里插入图片描述

2.2池化方法

什么是池化:
在这里插入图片描述

常见池化方法:
在这里插入图片描述

其他池化方法:
在这里插入图片描述

混合池化:

在这里插入图片描述

池化的必要性:

在这里插入图片描述

3.深度学习优化之泛化与正则化

3.1什么是泛化能力

在这里插入图片描述

泛化能力不好带来的问题:

在这里插入图片描述

3.2正则化方法:

在这里插入图片描述

3.2.1显式正则化方法:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

参数正则化方法:
在这里插入图片描述

3.2.2隐式正则化方法:

在这里插入图片描述

4.深度学习优化之优化目标与评估指标

4.1优化目标

在这里插入图片描述

两类基础任务与常见优化目标:
在这里插入图片描述

4.1.1分类任务损失

分类任务损失——0-1损失:
在这里插入图片描述

分类任务损失——交叉熵损失与KL散度:
在这里插入图片描述
在这里插入图片描述

分类任务损失——softmax损失的理解与改进:

在这里插入图片描述

分类任务损失——Hinge损失:
在这里插入图片描述

4.1.2回归任务损失

回归任务损失——L1/L2距离:
在这里插入图片描述

L1/L2距离的改进:
在这里插入图片描述

4.2评估指标

常见评测指标:
在这里插入图片描述

准确率/召回率/精确度/PR曲线:

在这里插入图片描述

ROC曲线/AUC面积:

在这里插入图片描述

混淆矩阵:
在这里插入图片描述

IoU(Intersection-over-Union):
在这里插入图片描述

AP(Average Precision)/mAP:

在这里插入图片描述
在这里插入图片描述

峰值信噪比PSNR:
在这里插入图片描述

结构一致性相似SSIM:
在这里插入图片描述

5.深度学习优化之最优化

5.1优化概述

最优化概述:
在这里插入图片描述

最优化目标比较:
在这里插入图片描述

鞍点:
在这里插入图片描述

什么是学习率:
在这里插入图片描述

5.2最优化方法

常见深度学习模型优化方法:
在这里插入图片描述

随机梯度下降法:

在这里插入图片描述

动量法:
在这里插入图片描述

Nesterov accelerated gradient法:
在这里插入图片描述

Adagrad法:
在这里插入图片描述

Adadelta与Rmsprop法:
在这里插入图片描述

Adam法:
在这里插入图片描述

Adam算法的改进:
在这里插入图片描述

5.3最优化方法的思考

SGD的改进算法一定更好吗?
在这里插入图片描述

二阶优化方法为何不用?
在这里插入图片描述

6.深度学习优化之数据增强

6.1数据增强概述

什么是数据增强:
在这里插入图片描述

为什么要做数据增强:
在这里插入图片描述

6.2经典数据增强方法

单样本集合变换:
在这里插入图片描述

单样本像素内容变换:
在这里插入图片描述

多样本插值:
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

链接地址:https://github.com/aleju

6.3自动数据增强方法

生成模型:
在这里插入图片描述

Autoaugment:

在这里插入图片描述

八、深度学习开源框架

1.Caffe简介

什么是Caffe:
在这里插入图片描述

Caffe的特点:

在这里插入图片描述

1.1Caffe的安装

依赖库安装(以虚拟环境Ubuntu为例):
在这里插入图片描述

Caffe官网地址链接:http://caffe.berkeleyvision.org/installation.html

NVIDIA驱动安装:
在这里插入图片描述

NVIDIA官网显卡查询地址链接:https://www.nvidia.com/Download/index.aspx

CUDA环境配置:
在这里插入图片描述

NVIDIA官网CUDA环境地址链接https://developer.nvidia.com/cuda-downloads

Caffe编译:
在这里插入图片描述
在这里插入图片描述

caffe配置地址链接:https://github.com/BVLC/caffe
在这里插入图片描述

1.2Caffe的相关使用简介

Caffe的完整目录:
在这里插入图片描述

基础函数:

在这里插入图片描述

Caffe的数据层次与使用流程:

在这里插入图片描述

基本数据格式Blob:

在这里插入图片描述

基本数据格式Layer:

在这里插入图片描述

Caffe中的序列化:

在这里插入图片描述

网络结构定义与可视化:
在这里插入图片描述

netscope网页工具可视化地址链接:http://ethereon.github.io/netscope/#/editor

优化器定义:
在这里插入图片描述

2.Pytorch简介

什么是Pytorch:

在这里插入图片描述

2.1Pytorch的安装

在这里插入图片描述

Pytorch官网地址链接:https://pytorch.org/

2.2Pytorch的相关使用简介

Pytorch完整的API:
在这里插入图片描述

API地址链接:https://pytorch.org/docs/stable/index.html

基本数据格式Tensor:
在这里插入图片描述

Tensor的自动微分autograd:

在这里插入图片描述
在这里插入图片描述

网络结构定义与前向传播:
在这里插入图片描述

优化器定义与反向传播:
在这里插入图片描述

数据接口:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3.TensorFlow简介

什么是TensorFlow:

在这里插入图片描述

3.1TensorFlow的安装

在这里插入图片描述

TensorFlow官网地址链接:https://www.tensorflow.org

TensorFlow的特点:
在这里插入图片描述

3.2TensorFlow的相关使用简介

TensorFlow的完整API:

TensorFlowAPI介绍(以1.15版本为例):
在这里插入图片描述

TensorFlow的API1.15版本地址链接:https://www.tensorflow.org/versions/r1.15/api_docs/python/tf
在这里插入图片描述

基本数据格式Tensor与算子op:
在这里插入图片描述

Tensor的数据流图:

在这里插入图片描述

Tensor的session会话:
在这里插入图片描述

基本数据格式常量与变量Variable:
在这里插入图片描述

基本数据格式占位符:

在这里插入图片描述

命名空间:
在这里插入图片描述

TensorFlow可视化工具:
在这里插入图片描述

网络结构单元:
在这里插入图片描述

数据接口:
在这里插入图片描述

数据预处理:
在这里插入图片描述

优化器定义:
在这里插入图片描述

九、深度学习模型设计

1.网络深度设计

1.1什么是网络深度

什么是网络深度:
在这里插入图片描述

为什么需要更深的模型:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

1.2基于深度的模型设计

AlexNet:
在这里插入图片描述

AlexNet工程技巧:
在这里插入图片描述

VGGNet:
在这里插入图片描述

VGGNet特点:
在这里插入图片描述

加深容易出现的问题:

在这里插入图片描述

2.网络宽度设计

2.1什么是网络宽度

什么是网络宽度:
在这里插入图片描述

为什么需要足够的宽度:
在这里插入图片描述

2.2基于宽度的模型设计

经典模型的宽度变化:
在这里插入图片描述

网络宽度设计:
在这里插入图片描述
在这里插入图片描述

模型性能:

网络宽度与深度对比:
在这里插入图片描述

3.卷积核设计

3.1基于参数压缩的卷积设计

1*1卷积:
在这里插入图片描述

1*1卷积典型应用:
在这里插入图片描述

小卷积的使用:
在这里插入图片描述

3.2基于感受野的卷积设计

膨胀卷积(带孔卷积,atrous convolution):
在这里插入图片描述

膨胀卷积设计:

在这里插入图片描述

可变形卷积:
在这里插入图片描述

非局部卷积;
在这里插入图片描述

3.3基于卷积操作的优化

移位网络:
在这里插入图片描述
在这里插入图片描述

加法网络:
在这里插入图片描述
在这里插入图片描述

4.残差网络设计

4.1什么是残差结构

网络加深遇到的优化问题:
在这里插入图片描述

short connect技术:
在这里插入图片描述

short connect早起验证:

在这里插入图片描述

4.2残差网络及有效性理解

在这里插入图片描述

残差网络有效性理解:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4.3残差网络的发展

密集残差网络:
在这里插入图片描述

更宽的残差网络:
在这里插入图片描述

分组残差ResNext:
在这里插入图片描述

Dual Path Network:
在这里插入图片描述

加权残差网络:
在这里插入图片描述

预激活残差:
在这里插入图片描述

5.分组网络设计

5.1什么是卷积分组

卷积拆分的使用:
在这里插入图片描述

通道分离卷积的来源:
在这里插入图片描述

GoogLeNet/Inception:
在这里插入图片描述

从Inception到Xception(extreme inception):
在这里插入图片描述

通道分组卷积模型基准MobileNet:
在这里插入图片描述

5.2不同通道分组策略

打乱重组的分组:
在这里插入图片描述

多尺度卷积核分组:
在这里插入图片描述

多分辨率卷积分组:
在这里插入图片描述
在这里插入图片描述

分组+整数的分组卷积;
在这里插入图片描述
在这里插入图片描述

级连分组卷积:
在这里插入图片描述

5.3可学习的分组网络

卷积核配置的学习:

在这里插入图片描述

分组连接的学习:

在这里插入图片描述
在这里插入图片描述

6.动态网络设计

6.1什么是动态网络

什么是动态变化的网络:
在这里插入图片描述

为什么要研究动态网络:
在这里插入图片描述

6.2基于丢弃策略的动态网络

随机深度残差网络:

在这里插入图片描述

模块丢弃残差网络:
在这里插入图片描述

BranchyNet网络:
在这里插入图片描述

Spatially Adaptive Computing Time(SACT):
在这里插入图片描述

6.3基于注意力机制的动态网络

动态卷积(Dynamic Convolution):
在这里插入图片描述

动态空间模型(Dynamic RegionAware Model):

在这里插入图片描述

6.4基于合并策略的动态网络

DeepRebirth:
在这里插入图片描述

RepVGG:

在这里插入图片描述

7.注意力机制设计

7.1注意力机制及其应用

什么是注意力机制:
在这里插入图片描述

注意力机制的典型应用:
在这里插入图片描述
在这里插入图片描述

7.2注意力模型设计

(以计算机视觉方程为例)

空间注意力机制:
在这里插入图片描述

空间注意力模型:
在这里插入图片描述

空间变换网络(spatial transform network):
在这里插入图片描述

通道注意力机制:
在这里插入图片描述

空间与通道注意力机制:
在这里插入图片描述

自注意力机制:
在这里插入图片描述
在这里插入图片描述

级连Attention:
在这里插入图片描述

十、深度生成模型

1.生成模型基础

1.1监督学习与无监督学习
1.1.1监督学习

什么是监督学习:
在这里插入图片描述

监督学习——判别模型:

在这里插入图片描述

监督学习——生成模型:
在这里插入图片描述

生成模型与判别模型的对比:
在这里插入图片描述

1.1.2无监督学习

什么是无监督学习:
在这里插入图片描述

1.2无监督生成模型

什么是无监督学习模型:
在这里插入图片描述

生成模型隐藏空间:
在这里插入图片描述

无监督生成模型分类:
在这里插入图片描述

显式生成模型求解:
在这里插入图片描述

隐式密度模型求解:

在这里插入图片描述

2.自编码器与变分自编码器

2.1自编码器

自编码器(AE):
在这里插入图片描述

自编码器的应用:
在这里插入图片描述

2.2变分自编码器

变分自编码器(VAE):
在这里插入图片描述

变分自编码器理论求解:
在这里插入图片描述
在这里插入图片描述

变分自编码器模型求解:
在这里插入图片描述
在这里插入图片描述

变分自编码器优化目标:
在这里插入图片描述

再参数化策略:
在这里插入图片描述

变分自编码器与自编码器对比:

在这里插入图片描述

AE与VAE的主要局限性:

在这里插入图片描述

3.生成网络基础

3.1什么是生成对抗网络(GAN)

生成对抗网络(GAN)如何生成数据:
在这里插入图片描述

生成对抗原理:
在这里插入图片描述

GAN的核心优化目标:
在这里插入图片描述

D的优化:
在这里插入图片描述

G的优化:
在这里插入图片描述

GAN的理想状态:
在这里插入图片描述

3.2生成对抗网络的训练问题

GAN的训练:
在这里插入图片描述

梯度不稳定与模式崩塌(collapse model)问题:
在这里插入图片描述

梯度消失问题:

在这里插入图片描述

3.3GAN的优化目标设计与改进
3.3.1原始GAN的优化目标的问题

JS散度度量问题:
在这里插入图片描述
在这里插入图片描述

梯度问题:
在这里插入图片描述

3.3.2优化目标的设计与改进

最小二乘损失GAN:
在这里插入图片描述

Energy-based GAN(EBGAN):

在这里插入图片描述

Wasserstein GAN:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

WGAN-GP:
在这里插入图片描述

Boundary Equilibrium GAN(BEGAN):
在这里插入图片描述
在这里插入图片描述

Loss Sensitive GAN:

在这里插入图片描述
在这里插入图片描述
Relativeistic GAN:
在这里插入图片描述

3.4GAN的评估
3.4.1GAN的评估问题

评估指标的要求:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

其他评估指标的要求:
在这里插入图片描述

3.4.2定量评估指标

GAN train/GAN test:
在这里插入图片描述

Inception分数:

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

Inception分数的缺陷与改进:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Frechet Inception Distance:

在这里插入图片描述
在这里插入图片描述

Kernel MMD(Kernel Maximum Mean Discrepancy):

在这里插入图片描述

Wasserstein Distance:
在这里插入图片描述

1-最近邻分类器:

在这里插入图片描述

3.5数据生成GAN结构与应用
3.5.1数据生成的应用

图片设计创作:
在这里插入图片描述

数据增强:
在这里插入图片描述

数据仿真:

在这里插入图片描述

视频生成、预测、编辑:

在这里插入图片描述

语音生成:
在这里插入图片描述

文本生成:
在这里插入图片描述

3.5.2图像生成模型结构

基本卷积GAN:
在这里插入图片描述

3.5.2.1从提高分辨率方面:

多尺度与残差GAN模型:

在这里插入图片描述
在这里插入图片描述

3.5.2.2从条件生成方面

条件生成GAN:
在这里插入图片描述

条件GAN模型:
在这里插入图片描述

半监督条件GAN模型:
在这里插入图片描述

属性向量的学习:

在这里插入图片描述

分层属性模型StyleGAN:
在这里插入图片描述
在这里插入图片描述

StyleGAN的应用:

在这里插入图片描述

3.6图像翻译GAN结构与应用
3.6.1图像翻译的应用

风格迁移:
在这里插入图片描述

数据增强:
在这里插入图片描述

经典图像任务:
在这里插入图片描述

内容创作:
在这里插入图片描述

人体图像编辑:

在这里插入图片描述

人脸图像编辑:人脸表情,年龄,妆造,身份编辑,动漫风格化等

3.6.2图像翻译模型
3.6.2.1有监督图像翻译模型

在这里插入图片描述
在这里插入图片描述

3.6.2.2无监督图像翻译模型

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

CycleGAN工程技巧:

在这里插入图片描述
在这里插入图片描述

多域图像翻译模型:

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1530421.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

FREERTOS队列集和事件标志组

队列集 一个队列只允许任务间传递的消息为同一种数据类型,如果需要在任务间传递不同数据类型的消息时,那么就可以使用队列集! 作用:用于对多个队列或信号量(信号量本质上也是个队列)进行“监听”&#xff…

python(Django)之登录功能实现

1、创建登陆函数 def login(request):if request.POST:username password username request.POST.get(username)password request.POST.get(password)user auth.authenticate(usernameusername, passwordpassword)if user is not None and user.is_active:auth.login(req…

医药工厂5G智能制造数字孪生可视化平台,推进医药企业数字化转型

医药工厂5G智能制造数字孪生可视化平台,推进医药企业数字化转型。随着科技的不断发展,数字化转型已成为医药企业不可或缺的一部分。5G智能制造医药工厂数字孪生可视化平台作为数字化转型的重要工具,正在逐步改变医药企业的生产方式和管理模式…

MATLAB:函数与数值积分

一、数学函数图像的绘制 clc,clear fh (x)2*exp(-x).*sin(x); Xrange [0,8]; gx (x)3*exp(-x)*0.8.*sin(x); fplot(fh,Xrange,r-*,LineWidth,1.5) hold on grid on fplot(gx,Xrange,b-o,LineWidth,1.5) axis([-0.5,8.5,-0.1,0.85]) legend(fh (x)2*exp(-x).*sin(x),gx (x…

QB PHP 多语言配置

1: 下载QBfast .exe 的文件 2: 安装的时候 ,一定点击 仅为我 安装 而不是 所有人 3: 如果提示 更新就 更新 , 安装如2 4: 如果遇到 新增 或者编辑已经 配置的项目时 不起作用 : 右…

【Linux】编译器-gcc/g++的使用(预处理、编译、汇编、连接)

目录 01.预处理(宏替换) 02.编译(生成汇编) 03.汇编(生成机器可识别码) 04.连接(生成可执行文件或库文件) 05.选项 编译器在编译代码时包含以下四个步骤:1.预处理 2…

读算法的陷阱:超级平台、算法垄断与场景欺骗笔记15_虚拟助手

1. 虚拟助手 1.1. 站在全球视角,这些公司是:亚马逊、脸书、谷歌和苹果 1.1.1. 苹果的Siri 1.1.2. 亚马逊的Alexa 1.1.3. 脸书Messenger应用上的M 1.1.4. 谷歌语音助手Assistant 1.2. 借由人工智能技术,虚拟助手将对用户的个人电子档案、…

机器学习 - 选择模型

接着这一篇博客做进一步说明: 机器学习 - 准备数据 PyTorch moduleExplaintorch.nnContains all of the building blocks for computational graphs (essentially a series of computations executed in a particular way). nn 模块为用户提供了丰富的神经网络组件…

【软件】项目管理工具focalboard使用docker部署

github官方网址 使用宝塔进入docker从官方进行镜像仓库拉去mattermost/focalboard 容器》添加容器》容器名》镜像》暴露端口》加号》添加 注意的是原始容器端口号为8000和9092

Vue使用qrcodejs2实现生成二维码

Vue使用qrcodejs2实现生成二维码示例 业务需求 比如说我们需要对下方的列表数据访问地址列进行生成二维码,扫描后跳转对应的地址。 安装qrcodejs2依赖 npm i qrcodejs2引用 在我们需要使用的页面进行引用qrcodejs2 import QRCode from qrcodejs2定义我们的二维…

业务服务:redisson

文章目录 前言一、配置1. 添加依赖2. 配置文件/类3. 注入redission3. 封装工具类 二、应用1. RedisUtils工具类的基本使用 三、队列1. 工具类2. 普通队列2. 有界队列(限制数据量) 前言 redission是一个开源的java redis的客户端,在其基础上进…

备战蓝桥杯---牛客寒假训练营2VP

题挺好的,收获了许多 1.暴力枚举(许多巧妙地处理细节方法) n是1--9,于是我们可以直接暴力,对于1注意特判开头0但N!1,对于情报4,我们可以把a,b,c,d的所有取值枚举一遍,那么如何判断有…

机器学习——编程实现从零构造训练集的决策树

自己搭建一棵决策树【长文预警】 忙了一个周末就写到了“构建决策树”这一步,还没有考虑划分测试集、验证集、“缺失值、连续值”,预剪枝、后剪枝的部分,后面再补吧(挖坑) 第二节内容:验证集划分\k折交叉…

Docker-安装

Docker ⛅Docker-安装🌠各平台支持情况🌠Server 版本安装☃️Ubuntu☃️Centos 🌠Docker 镜像源修改🌠Docker 目录修改 ⛅Docker-安装 🌠各平台支持情况 🌠Server 版本安装 ☃️Ubuntu 🍂安装…

地脚螺栓的介绍

地脚螺栓简单来说,它是一种机械构件。通常用于铁路、公路、电力、桥梁、锅炉钢结构、塔吊、大型建筑等。一头预埋在地底下,另一头穿过设备用螺母拧紧,用来固定设备,钢结构设施,铁塔设施等,所以地脚螺栓拥有…

上海亚商投顾:沪指震荡调整 北向资金全天净卖出超70亿

上海亚商投顾前言:无惧大盘涨跌,解密龙虎榜资金,跟踪一线游资和机构资金动向,识别短期热点和强势个股。 一.市场情绪 沪指昨日震荡调整,创业板指尾盘跌超1%。猪肉股集体反弹,播恩集团、湘佳股份、傲农生物…

vue项目:使用xlsx导出Excel数据

文章目录 一、安装xlsx二、报错及解决三、编写公共方法四、方法使用 一、安装xlsx 执行命令:npm i xlsx file-saver --save 二、报错及解决 使用时:import XLSX from "xlsx"; 发现如下报错信息 报错原因:xlsx版本不兼容。 解…

幼犬狗粮和成年犬狗粮该怎么挑选?

亲爱的狗友们,我们都知道,给狗狗选择适合的狗粮是非常重要的。那么,面对市面上琳琅满目的幼犬狗粮和成年犬狗粮,我们该如何挑选呢?别担心,接下来就让我来给大家支支招。 🐶 幼犬狗粮挑选篇 &…

Linux 网络接口管理

为了更深入的了解linux系统,为此做出网络接口管理的知识总结。看起来麻烦,其实一点都不难,相信多看多了解总会是没错的!❤️❤️ 一起加油吧!✨✨🎉🎉 文章目录 前言一、网络配置的文件介绍二、…

路由器怎么做端口映射

路由器在网络中起到了连接不同设备和提供网络服务的重要作用。端口映射是一项常见的操作,它允许外部网络中的设备通过路由器访问内部网络中的设备。我们将介绍如何在路由器上进行端口映射的设置。 理解端口映射 在开始操作之前,我们需要了解一些基本概念…