中国工程网查询_小程序制作实惠首选华网天下_百度百科词条入口_google搜索中文入口

时间:2025/9/16 10:26:18来源：https://blog.csdn.net/qq_62107003/article/details/146988542 浏览次数:1次

一、WGAN-GP 原理

Wasserstein GAN with Gradient Penalty (WGAN-GP) 是对原始 WGAN 的改进，通过梯度惩罚（Gradient Penalty）替代权重裁剪（Weight Clipping），解决了 WGAN 训练不稳定、权重裁剪导致梯度消失或爆炸的问题。

(1) Wasserstein 距离（Earth-Mover 距离）

原始 GAN 的 JS 散度在分布不重叠时梯度消失，而 WGAN 使用 Wasserstein 距离衡量生成分布 $P_g$ 和真实分布 $P_r$ 的距离：
$W(P_r, P_g) = \inf_{\gamma \sim \Pi(P_r, P_g)} \mathbb{E}_{(x,y)\sim \gamma} [\|x-y\|]$
通过 Kantorovich-Rubinstein 对偶形式，转化为：
$W(P_r, P_g) = \sup_{\|D\|_L \leq 1} \mathbb{E}_{x \sim P_r}[D(x)] - \mathbb{E}_{z \sim P_z}[D(G(z))]$ ，其中 $D$ 是 1-Lipschitz 函数（梯度范数不超过 1）

(2) 梯度惩罚（Gradient Penalty）

原始 WGAN 的问题：通过权重裁剪强制判别器（Critic）满足 Lipschitz 约束，但会导致梯度不稳定或容量下降
WGAN-GP 的改进：直接对判别器的梯度施加惩罚项，强制其梯度范数接近 1： $\lambda \cdot \mathbb{E}_{\hat{x} \sim P_{\hat{x}}}$

关键字：中国工程网查询_小程序制作实惠首选华网天下_百度百科词条入口_google搜索中文入口

本网仅为发布的内容提供存储空间，不对发表、转载的内容提供任何形式的保证。凡本网注明“来源：XXX网络”的作品，均转载自其它媒体，著作权归作者所有，商业转载请联系作者获得授权，非商业转载请注明出处。

我们尊重并感谢每一位作者，均已注明文章来源和作者。如因作品内容、版权或其它问题，请及时与我们联系，联系邮箱：809451989@qq.com，投稿邮箱：809451989@qq.com

责任编辑：