【笔记】对抗训练-GAN

【笔记】对抗训练-GAN

news2025/4/16 16:24:48

对抗训练-GAN

深度学习中 GAN 的对抗目标函数详解与最优解推导
- 一、GAN 的基本对抗目标函数
- 二、判别器与生成器的博弈目标
- 三、判别器的最优解推导
- 四、最优判别器的含义
- 五、总结
- 六、WGAN 的动机（为后续铺垫）

深度学习中 GAN 的对抗目标函数详解与最优解推导

生成对抗网络（GAN）是深度生成模型中的经典方法，其核心思想是两个网络之间的博弈：生成器 $G$ 试图“伪造”样本，而判别器 $D$ 尽力分辨真伪。本篇博客将从 GAN 的基本目标函数出发，逐步推导出判别器的最优形式，并分析其背后的数学含义。

一、GAN 的基本对抗目标函数

GAN 的原始目标是一个 min-max 游戏：

$\min_G \max_D \left( \mathbb{E}_{x \sim P_r}[\log D(x)] + \mathbb{E}_{z \sim P_z}[\log(1 - D(G(z)))] \right)$

其中：

$P_r(x)$ 表示真实数据的分布；
$P_z(z)$ 是先验噪声分布（如高斯）；
$G (z)$ 是生成器生成的假样本；
$D (x)$ 是判别器输出 $x$ 为真实样本的概率。

二、判别器与生成器的博弈目标

判别器 D 的目标：让 $D (x)$ 趋近于 1， $D (G (z))$ 趋近于 0，即正确分辨真实与生成样本。

对应目标函数为最大化：

$\mathbb{E}_{x \sim P_r}[\log D(x)] + \mathbb{E}_{z \sim P_z}[\log(1 - D(G(z)))]$
生成器 G 的目标：生成样本让 $D (G (z))$ 尽量大，即“骗过”判别器。

对应目标函数为最小化：

$\mathbb{E}_{z \sim P_z}[\log(1 - D(G(z)))]$

这是一个典型的零和对抗过程。

三、判别器的最优解推导

我们接下来推导：在固定生成器 $G$ 的前提下，判别器 $D$ 的最优形式是怎样的？

令目标函数为：

$\int_x P_r(x) \log D(x) + P_g(x) \log(1 - D(x)) \, dx$

对每个 $x$ ，令：

$f(D(x)) = P_r(x) \log D(x) + P_g(x) \log(1 - D(x))$

对 $D (x)$ 求导并令导数为 0：

$\frac{d f}{d D(x)} = \frac{P_r(x)}{D(x)} - \frac{P_g(x)}{1 - D(x)} = 0$

解得最优判别器为：

$D^*(x) = \frac{P_r(x)}{P_r(x) + P_g(x)}$

四、最优判别器的含义

$D^*(x)$ 的输出值反映了 样本 $x$ 来自真实分布的概率。
- 如果 $P_r(x) = P_g(x)$ ，则 $D^*(x) = \frac{1}{2}$ ；
- 如果 $P_r(x) \gg P_g(x)$ ，则 $D^*(x) \approx 1$ ；
- 如果 $P_g(x) \gg P_r(x)$ ，则 $D^*(x) \approx 0$ 。
将 $D^*$ 代入 GAN 原始目标函数：

$V(D^*) = \mathbb{E}_{x \sim P_r}[\log D^*(x)] + \mathbb{E}_{x \sim P_g}[\log(1 - D^*(x))]$

可推导出最终目标：

$\min_G V(D^*) = -\log 4 + 2 \cdot \text{JS}(P_r \parallel P_g)$

即：GAN 实质上是在最小化真实分布 $P_r$ 与生成分布 $P_g$ 之间的 Jensen-Shannon 散度。

五、总结

内容	含义
$D^*(x) = \frac{P_r(x)}{P_r(x) + P_g(x)}$	判别器在每个样本点处的最优输出
GAN 的优化目标	最小化 JS 散度
最优时的结果	当 $P_r = P_g$ 时，GAN 达到最优， $D (x) = 0.5$ ，分不出真假

六、WGAN 的动机（为后续铺垫）

由于 Jensen-Shannon 散度在 $P_r$ 与 $P_g$ 没有交集时不连续（导致梯度消失），Wasserstein GAN（WGAN）改用 Wasserstein 距离替代 JS 散度，并要求判别器满足 1-Lipschitz 条件，这会在后续单独展开讲解。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2335304.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

AIoT 智变浪潮演讲实录 | 刘浩然：让硬件会思考：边缘大模型网关助力硬件智能革新

AIoT 智变浪潮演讲实录 | 刘浩然：让硬件会思考：边缘大模型网关助力硬件智能革新

4 月 2 日，由火山引擎与英特尔联合主办的 AIoT “智变浪潮”技术沙龙在深圳成功举行，活动聚焦 AI 硬件产业的技术落地与生态协同，吸引了芯片厂商、技术方案商、品牌方及投资机构代表等 700 多位嘉宾参会。会上，火山引擎边缘智能高…

阅读更多...

【Windows】系统安全移除移动存储设备指南：告别「设备被占用」弹窗

【Windows】系统安全移除移动存储设备指南：告别「设备被占用」弹窗

Windows系统安全移除移动存储设备指南：告别「设备被占用」弹窗解决移动硬盘和U盘正在被占用无法弹出一、问题背景使用Windows系统时，经常遇到移动硬盘/U盘弹出失败提示「设备正在使用中」，即使已关闭所有可见程序。本文将系统梳理已验证…

阅读更多...

ArmSoM Sige5 CM5：RK3576 上 Ultralytics YOLOv11 边缘计算新标杆

ArmSoM Sige5 CM5：RK3576 上 Ultralytics YOLOv11 边缘计算新标杆

在计算机视觉技术加速落地的今天，ArmSoM 正式宣布其基于 Rockchip RK3576 的旗舰产品 Sige5 开发板和 CM5 核心板全面支持 Ultralytics YOLOv11 模型的 RKNN 部署。这一突破标志着边缘计算领域迎来新一代高性能、低功耗的 AI 解决方案&am…

阅读更多...

【ubuntu】linux开机自启动

【ubuntu】linux开机自启动

目录开机自启动： /etc/rc.loacl system V 使用/etc/rc*.d/系统运行优先级遇到的问题： 1. Linux 系统启动阶段概述方法1：/etc/rc5.d/ 脚本延时日志方法二：使用 udev 规则来触发脚本执行开机自启动： /etc/…

阅读更多...

操作系统导论——第19章分页：快速地址转换（TLB）

操作系统导论——第19章分页：快速地址转换（TLB）

使用分页作为核心机制来实现虚拟内存，可能会带来较高的性能开销。使用分页，就要将内存地址空间切分成大量固定大小的单元（页），并且需要记录这些单元的地址映射信息。因为这些映射信息一般存储在物理内存中，…

阅读更多...

计算机网络：流量控制与可靠传输机制

计算机网络：流量控制与可靠传输机制

目录基本概念流量控制：别噎着啦！ 可靠传输：快递必达服务传输差错：现实中的意外滑动窗口基本概念换句话说：批量发货排队验收停止-等待协议 SW（发1份等1份） 超时重传：…

阅读更多...

架构生命周期（高软57）

架构生命周期（高软57）

系列文章目录架构生命周期文章目录系列文章目录前言一、软件架构是什么？二、软件架构的内容三、软件设计阶段四、构件总结前言本节讲明架构设计的架构生命周期概念。一、软件架构是什么？ 二、软件架构的内容三、软件设计阶段四、构件总结就…

阅读更多...

JMeter使用

JMeter使用

1.简介 1.1 打开方式 ①点击bat,打开 ②添加JMeter系统环境变量,输⼊命令jmeter即可启动JMeter⼯具 1.2 配置简体中文放大字体 1.3 使用 ①添加线程组 ②创建http请求 2. 组件 2.1 线程组控制JMeter将⽤于执⾏测试的线程数，也可以把⼀个线程理解为⼀个测…

阅读更多...

Ant Design Vue 表格复杂数据合并单元格

Ant Design Vue 表格复杂数据合并单元格

Ant Design Vue 表格复杂数据合并单元格官方合并效果官方示例表头只支持列合并，使用 column 里的 colSpan 进行设置。表格支持行/列合并，使用 render 里的单元格属性 colSpan 或者 rowSpan 设值为 0 时，设置的表格不会渲染。 <temp…

阅读更多...

ECharts 如何实现柱状图悬停时，整个背景区域均可触发点击事件

ECharts 如何实现柱状图悬停时，整个背景区域均可触发点击事件

1. 前言 ECharts 柱状图的点击事件默认仅响应柱子本身的点击，本文旨在实现整个背景区域均可触发点击事件 2. 实现思路核心：全局监听坐标判断数据转换通过 getZr() 监听整个画布点击，结合像素坐标判断是否在图表区域内‌通过 containPi…

阅读更多...

金融简单介绍及金融诈骗防范

金融简单介绍及金融诈骗防范

在当今社会，金融学如同一股无形却强大的力量，深刻影响着我们生活的方方面面。无论是个人的日常收支、投资理财，还是国家的宏观经济调控，都与金融学紧密相连。一、金融学的概念金融学，简单来说，是研…

阅读更多...

cursor+高德MCP：制作一份旅游攻略

cursor+高德MCP：制作一份旅游攻略

高德开放平台 | 高德地图API (amap.com) 1.注册成为开发者 2.进入控制台选择应用管理----->我的应用 3.新建应用 4.点击添加Key 5.在高德开发平台找到MCP的文档 6.按照快速接入的步骤，进行操作一定要按照最新版的cursor, 如果之前已经安装旧的版本卸载掉重新安…

阅读更多...

Kubernetes控制平面组件：API Server Webhook 授权机制详解

Kubernetes控制平面组件：API Server Webhook 授权机制详解

云原生学习路线导航页（持续更新中） kubernetes学习系列快捷链接 Kubernetes架构原则和对象设计（一）Kubernetes架构原则和对象设计（二）Kubernetes架构原则和对象设计（三）Kubernetes控…

阅读更多...

【Python爬虫】简单案例介绍2

【Python爬虫】简单案例介绍2

本文继续接着我的上一篇博客【Python爬虫】简单案例介绍1-CSDN博客目录跨页 3.2 环境准备跨页当对单个页面的结构有了清晰的认识并成功提取数据后，接下来就需要考虑页面之间的跨页问题。此时我们便迎来了下一个关键任务：如何实现跨页爬取&#xf…

阅读更多...

【神经网络】python实现神经网络（四）——误差反向传播的基础理论

【神经网络】python实现神经网络（四）——误差反向传播的基础理论

一.反向传播本章将介绍能够高效计算权重参数的梯度的方法——误差反向传播法，这里简单介绍一下什么是反向传播，加入有个函数y = f(x)，那么它的反向传播为图下这个样子：反向传播的计算顺序是，将输入信号E乘以节点的局部导数，然后将结果传递给下一个节点。这里所…

阅读更多...

I/O进程（全）

I/O进程（全）

I/O 一、标准IO 1.概念在C库中定义的一组用于输入输出的函数 2.特点 (1).通过缓冲机制减少系统调用，提高效率 (2.)围绕流进行操作，流用FILE *来描述(3).标准IO默认打开了三个流，stdin（标准输入）、stdout（标…

阅读更多...

vue2使用ezuikit-js播放萤石视频

vue2使用ezuikit-js播放萤石视频

需求：需要在大屏上播放萤石视频，用到官方的ezuikit-js插件实现，并实现视频播放切换功能。有个问题至今没有解决，就是萤石视频的宽高是固定的，不会根据大屏缩放进行自适应。我这边做了简单的刷新自适应。 1.下载ezuikit…

阅读更多...

【笔试强训day19】

【笔试强训day19】

目录第一题：小易的升级之路描述输入描述： 输出描述： 输入： 输出： 第二题：礼物的最大价值描述输入： 返回值： 备注： 第三题：对称之美题目描述…

阅读更多...

STM32电机库电机控制特性

STM32电机库电机控制特性

ST MC FW库提供FOC和六步法两种电机控制方式。这使得它能够驱动永磁同步电机（PMSM）和无刷直流电机（BLDC）。FOC 更适合 PMSM，而六步法更适合 BLDC 电机。该固件可以驱动内嵌式PMSM 和标贴式PMSM。 ST Motor Control 固件库提供以下功能： FOC SVPWM 生成：可配置的 PW…

阅读更多...

【Linux】42.网络基础（2.4）

【Linux】42.网络基础（2.4）

文章目录 2.3 TCP协议2.3.10 拥塞控制2.3.11 延迟应答2.3.12 捎带应答2.3.13 面向字节流2.3.14 粘包问题2.3.15 TCP异常情况2.3.16 TCP小结2.3.17 基于TCP应用层协议 2.3 TCP协议 2.3.10 拥塞控制虽然TCP有了滑动窗口这个大杀器, 能够高效可靠的发送大量的数据. 但是如果在刚…

阅读更多...

推荐文章

最新文章