生成对抗网络GAN

news2026/4/5 0:30:01

1.基本概念

生成对抗网络Generative Adversarial Networks（GAN）包含生成模型（generative model）和判别模型 (discriminative model) 两个模型。生成模型的任务是生成和原始数据相似的实例，判别模型的任务是判断给定的实例是真实的还是伪造的。

训练过程中，生成器在生成逼真图像方面能力逐渐变强，而判别器在辨别这些图像的能力上逐渐变强。当判别器不再能够区分真实图片和伪造图片时，训练过程达到平衡。

如上图所示，生成器充当“艺术家”，生成许多看起来像真实的猫的图像。判别器充当”艺术评论家”，评判生成器生成的图像是否是真实的。

一开始生成器生成的图像和真实图像差距较大，因此判别器很容易判别出这是假的图像。随着训练次数的增加，生成器不断接收判别器的反馈来修改生成数据的分布，直到生成器生成的图像和真实图像的数据分布一致且判别器也判别不出来到底是真的数据还是假的数据，此时，训练过程达到一个平衡状态。这就是GAN“对抗生成”的基本理念。看起来还是比较好理解的是把！

我们再来看一个比较形象的例子：警察和罪犯

•罪犯的目标：想出伪造货币的方法，让警察无法区分假币和真币。

•警察的目标：想出辨别货币的方法，能够区分假币和真币。

随着这个过程不断继续，警察会想出越来越复杂的技术来鉴别假币，罪犯也会想出越来越复杂的技术来伪造货币。这就是 GAN 中“对抗过程”的基本理念。

GAN 充分利用“对抗过程”训练两个神经网络，这两个网络会互相博弈直至达到一种理想的平衡状态，警察和罪犯就相当于这两个神经网络。其中一个神经网络叫做生成器网络G(Z), 使用输入随机噪声数据生成和已有数据集非常接近的数据；另一个神经网络叫鉴别器网络D(X), 以生成的数据作为输入，尝试鉴别出哪些是生成的数据，哪些是真实数据。鉴别器的核心是实现二元分类，输出的结果是输入数据来自真实数据集和合成数据的概率。

2.学习路线

本博客首先介绍了GAN的理论基础，在后续的博客中会分为几个阶段分别向大家介绍关于GAN的内容包括方法改进和场景应用，敬请期待！

判别方法学习得到的是一个判断数据是否属于某一类的模型，而生成方法则学习到数据的分布。

判别器训练

1.对生成器输入一段噪音，输出一个符合某一分布的假数据(如一组图片的分布);

2.从生成的分布中抽取一些数据，标记为0，从真实样本集中抽取一些数据，标记为1；

3.将数据喂给判别器进行训练，使判别器能够很好的分辨数据的真伪，判别器训练完成。

生成器训练

4.将生成器与判别器进行逻辑连接，生成器产生的假数据全部标记为1喂给判别器；

5.喂给网络的数据产生的误差，通过误差反向传播算法传递给训练器，修正生成器的参数（此处为GAN算法精妙之处，生成器与判别器是逻辑相连，误差仅仅修正生成器而不改变判别器的参数）

6.不断训练判别器和生成器，直到判别器无法分辨假数据和真实数据，即判别器输出结果的概率都是0.5。

判别器输入真实数据，输出越大越好；生成器输入假数据时，输出越小越好。

训练K次判别器，训练1次生成器。训练期间最大化判别器价值函数，最小化生成器损失函数。对价值函数

3.实验效果

4.总结分析

优势：

1.只需用反向传播和梯度下降方式进行训练

2.不需要用前像素预测后像素，直接从端到端的以神经网络的方式来进行预测

3.生成器的训练是间接通过判别器的训练来进行的，有效防止了过拟合

4.GAN可以表示非常尖锐甚至恶化，退化的分布

劣势：

1.不能得到原始数据的真实分布

2.判别器和生成器必须同时训练，否则会导致模式崩溃（模型学习到真实样本的分布一部分，导致模型生成的样本非常单一，样本差异较小。）

5.未来展望

关于GAN的几个研究方向：

1.条件GAN：CGAN 告诉模型要生成什么样的类别，而不是通过判别器的训练来间接拟合噪声数据的分布。

2.预测输入图像的噪音，了解噪音具体代表的意义。比如头发颜色，眼睛大小等-StyleGAN

3.图像填充（Image inpainting）和超分辨率（Super resolution）

4.在标注比较少的情况下，可以利用判别器的特征来辅助分类

5.改进GAN的训练方式（损失函数，训练技巧，优化器，交替训练的方式）

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/444560.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

四百左右音质好的蓝牙耳机有哪些？2023公认音质最好的蓝牙耳机排行

四百左右音质好的蓝牙耳机有哪些？2023公认音质最好的蓝牙耳机排行

与有线耳机相比，蓝牙耳机有着功能多样、使用便捷的优点。最近看到很多人问，四百内音质好的蓝牙耳机有哪些？针对这个问题，我来给大家推荐几款音质最好的蓝牙耳机，一起来看看吧。一、南卡小音舱Lite2蓝牙耳机参考价&…

阅读更多...

Mybatis（九）插件原理及应用

Mybatis（九）插件原理及应用

一、Mybatis的插件实现原理 Mybatis允许用户通过自定义拦截器的方式改变Sql的执行方式，例如在Sql执行时追加Sql分页语法，从而达到减缓分页查询的目的，用户自定义拦截器也被称为Mybatis插件。我们先从插件的配置及解析过程来分析插件&#…

阅读更多...

蓝奥声核心技术分享——基于物联网的无线智能标签刷新控制技术

蓝奥声核心技术分享——基于物联网的无线智能标签刷新控制技术

1.技术背景基于物联网的无线智能标签刷新控制技术指基于对目标场景状态变化的协同感知而获得触发响应并进行智能决策，属于蓝奥声核心技术--边缘协同感知(EICS）技术的关键支撑性技术之一。该项技术涉及物联网边缘域的无线通信与智能控制技术领域。物联…

阅读更多...

学习同步异步的概念，并了解MQ消息队列

学习同步异步的概念，并了解MQ消息队列

文章目录一、同步和异步1.1 同步调用1.2 异步调用二、MQ1.1 介绍1.2 MQ的优点和使用场景一、同步和异步 1.1 同步调用同步调用是一种程序调用方式，在该调用方式中，调用者发起一个请求，然后一直等待被调用者返回响应结果后再继续执行。…

阅读更多...

wps - 使用宏来为每行标记序号

wps - 使用宏来为每行标记序号

在WPS中遇到需要加序号的虽然可以用项目符符号来标注# 但或许用宏更厉害一些 WPS 的宏是一种自动化工具，可以通过编写宏代码来自动执行一些操作，例如创建和编辑文档、打印、格式化等。 WPS 宏的编写可以使用 VBA（Visual Basic for Applicat…

阅读更多...

236. 二叉树的最近公共祖先 ——【Leetcode每日一题】

236. 二叉树的最近公共祖先 ——【Leetcode每日一题】

236. 二叉树的最近公共祖先给定一个二叉树, 找到该树中两个指定节点的最近公共祖先。百度百科中最近公共祖先的定义为：“对于有根树 T 的两个节点 p、q，最近公共祖先表示为一个节点 x，满足 x 是 p、q 的祖先且 x 的深度尽可能大&#xff…

阅读更多...

inode和软硬链接

inode和软硬链接

文章目录： 一、理解文件系统1.1 什么是inode1.2 磁盘了解1.2.1磁盘的硬件结构1.2.2 磁盘的分区1.2.3 EXT2文件系统二、软硬链接2.1 软链接2.2 硬链接一、理解文件系统 1.1 什么是inode inodes 是文件系统中存储文件元数据的数据结构。每个文件或目录都有一个唯一…

阅读更多...

JavaSE学习进阶day06_01 数据结构（进阶）

JavaSE学习进阶day06_01 数据结构（进阶）

第一章数据结构（温习数据结构的内容） 1.1 树基本结构介绍树具有的特点： 每一个节点有零个或者多个子节点没有父节点的节点称之为根节点，一个树最多有一个根节点。每一个非根节点有且只有一个父节点名词含义节点指树中的…

阅读更多...

第二届“威固新能源 GO野”，威固重塑新能源出行不凡体验

第二届“威固新能源 GO野”，威固重塑新能源出行不凡体验

中国，上海，近日——全球特种材料公司伊士曼旗下汽车膜品牌威固（V-KOOL），于近日开启了第二届“威固新能源 GO野”不凡之旅，通过专为新能源而来的创新产品与服务，引领高端新能源车主驶出城市生活的…

阅读更多...

晨控可视化标签在资产管理上的应用及优势

晨控可视化标签在资产管理上的应用及优势

晨控可视化标签在资产管理上的应用及优势资产是企业功能的核心组成部分，是企业重要的基础设施建设。资产存在的形式各种各样，不仅具有价值高、流动性强、安全管理困难的特点，而且成为资产管理的重要环境之一。通过射频识别技术，…

阅读更多...

【00-Java Web先导课】-如何进行IDEA的安装

【00-Java Web先导课】-如何进行IDEA的安装

前沿 Pycharm与IDEA激活教程一样，本篇以IDEA激活教程为例进行保姆级教学文章目录前沿一、支持系统二、软件版本1.引入库三、软件下载教程1、点击网址进入jetbrains官网2、按照下图选择相应下载的软件3、按照如图选择需要下载的版本4、按照如下方式进行下载软件四…

阅读更多...

Web服务器

Web服务器

目录什么是Web服务器？ Web容器 Servlet Servlet 规范 Servlet 的API结构编写Servlet servlet生命周期（产生到销毁的过程） 服务器产生响应信息的两种格式什么是Web服务器？ Web服务器是一个程序，用于接收客户…

阅读更多...

【LeetCode: 718. 最长重复子数组 | 暴力递归=＞记忆化搜索=＞动态规划】

【LeetCode: 718. 最长重复子数组 | 暴力递归=＞记忆化搜索=＞动态规划】

🚀 算法题 🚀 🌲 算法刷题专栏 | 面试必备算法 | 面试高频算法 🍀 🌲 越难的东西,越要努力坚持，因为它具有很高的价值，算法就是这样✨ 🌲 作者简介：硕风和炜，…

阅读更多...

Scillus | 来吧！它可以大大简化你的Seurat分析流程哦！~（一）（数据预处理）

Scillus | 来吧！它可以大大简化你的Seurat分析流程哦！~（一）（数据预处理）

1写在前面太久没更了，真是累到极致，每天回到家都只想睡觉。😭 今天介绍一下Scillus包，是一个基于Seurat和ggplot2的R包，用于增强scRNA-seq数据的处理和可视化。🧐 它可以对Seurat对象进行多种类型的图形展…

阅读更多...

多重背包问题的三种解法(转化为01背包、二进制拆分、单调队列优化)

多重背包问题的三种解法(转化为01背包、二进制拆分、单调队列优化)

多重背包问题的三种解法转化为01背包二进制拆分优化单调队列优化转化为01背包题目链接:acwing4. 多重背包问题 I 题目描述数据范围思路： 可以转化为01背包问题求解，将s个物品都看作单独的一个物品，时间复杂度为 O ( N ∗ V ∗ S ) O(…

阅读更多...

【一】MATLAB基础知识

【一】MATLAB基础知识

【一】MATLAB基础知识 1 数值数据类型的分类整型无符号整数：无符号8位整数、无符号16位整数、无符号32位整数、无符号64位整数。带符号整数：带符号8位整数、带符号16位整数、带符号32位整数、带符号64位整数。无符号8位整数数据范围&#xff…

阅读更多...

树和二叉树（概念及其结构）

树和二叉树（概念及其结构）

1.树概念及结构（了解）‘ 1.1树的概念树是一种非线性的数据结构，它是由n（n>0）个有限结点组成一个具有层次关系的集合。把它叫做树是因为它看起来像一颗倒挂的树，也就是说它是根朝上，而叶…

阅读更多...

php+vue+mysql校园大学生兼职信息网站系统

php+vue+mysql校园大学生兼职信息网站系统

商家功能模块商家通过点击后台管理，进入页面可以进行首页、个人中心、热门兼职管理、兼职接单管理、学生咨询管理、兼职任务管理、完成评价管理等功能模块，进行相对应操作兼职接单管理：通过兼职接单管理可以进行获取兼职名称、专业、分类、…

阅读更多...

佳电股份:智能互联绿色驱动拥抱未来

佳电股份:智能互联绿色驱动拥抱未来

4月 13—15 日，2023年易派客工业品展览会、石油石化工业展览会、第七届中国石油和化工行业采购年会，在苏州国际博览中心举行。在本次展会上，佳电股份展出了超高速永磁电机、超高效高压三相异步电动机、智慧电机以及配套服务等主要产品。哈尔…

阅读更多...

linux 下 mysql 平滑升级，不暴力

linux 下 mysql 平滑升级，不暴力

只适合版本跨越较小的，如果从5到8这种不支持查看当前版本5.6.40,升级到5.6.50（因为一些漏洞的原因） 1：下载需要升级的版本 2：解压 3：停止当前的mysql服务 service mysql stop 4：备份原先系…

阅读更多...

推荐文章

最新文章