GAN 令人拍案叫绝的Wasserstein (令人拍案)

雷锋网按：本文作者郑华滨，原载于知乎。雷锋网已获转载授权。

令人拍案叫绝的Wasserstein GAN

在GAN的相关研究如火如荼甚至可以说是泛滥的今天，一篇新鲜出炉的arXiv论文《Wassertein GAN》却在Reddit的Machine Learning频道火了，连GoodFellow都在帖子里和大家热烈讨论，这篇论文究竟有什么了不得的地方呢？

要知道自从2014年Ian Goodfellow提出以来，GAN就存在着训练困难、生成器和判别器的loss无法指示训练进程、生成样本缺乏多样性等问题。从那时起，很多论文都在尝试解决，但是效果不尽人意，比如最有名的一个改进DCGAN依靠的是对判别器和生成器的架构进行实验枚举，最终找到一组比较好的网络架构设置，但是实际上是治标不治本，没有彻底解决问题。而今天的主角Wasserstein GAN（下面简称WGAN）成功地做到了以下爆炸性的几点：

那以上好处来自哪里？这就是令人拍案叫绝的部分了——实际上作者整整花了两篇论文，在第一篇《Towards Principled Methods for Training Generative Adversarial Networks》里面推了一堆公式定理，从理论上分析了原始GAN的问题所在，从而针对性地给出了改进要点；在这第二篇《Wassertein GAN》里面，又再从这个改进点出发推了一堆公式定理，最终给出了改进的算法实现流程，而改进后相比原始GAN的算法实现流程却只改了四点：

算法截图如下：

令人拍案叫绝的Wasserstein GAN

改动是如此简单，效果却惊人地好，以至于Reddit上不少人在感叹：就这样？没有别的了？太简单了吧！这些反应让我想起了一个颇有年头的鸡汤段子，说是一个工程师在电机外壳上用粉笔划了一条线排除了故障，要价一万美元——画一条线，1美元；知道在哪画线，9999美元。上面这四点改进就是作者Martin Arjovsky划的简简单单四条线，对于工程实现便已足够，但是知道在哪划线，背后却是精巧的数学分析，而这也是本文想要整理的内容。

本文内容分为五个部分：

理解原文的很多公式定理需要对测度论、拓扑学等数学知识有所掌握，本文会从直观的角度对每一个重要公式进行解读，有时通过一些低维的例子帮助读者理解数学背后的思想，所以不免会失于严谨，如有引喻不当之处，欢迎在评论中指出。

以下简称《Wassertein GAN》为“WGAN本作”，简称《Towards Principled Methods for Training Generative Adversarial Networks》为“WGAN前作”。

WGAN源码实现： martinarjovsky/WassersteinGAN

第一部分：原始GAN究竟出了什么问题？

回顾一下，原始GAN中判别器要最小化如下损失函数，尽可能把真实样本分为正例，生成样本分为负例：

令人拍案叫绝的Wasserstein GAN （公式1 ）

其中令人拍案叫绝的Wasserstein GAN 是真实样本分布，是由生成器产生的样本分布。对于生成器，Goodfellow一开始提出来一个损失函数，后来又提出了一个改进的损失函数，分别是

令人拍案叫绝的Wasserstein GAN （公式2）

令人拍案叫绝的Wasserstein GAN （公式3）

后者在WGAN两篇论文中称为“the - log D alternative”或“the - log D trick”。WGAN前作分别分析了这两种形式的原始GAN各自的问题所在，下面分别说明。

第一种原始GAN形式的问题

一句话概括：判别器越好，生成器梯度消失越严重。WGAN前作从两个角度进行了论证，第一个角度是从生成器的等价损失函数切入的。

首先从公式1可以得到，在生成器G固定参数时最优的判别器D应该是什么。对于一个具体的样本，它可能来自真实分布也可能来自生成分布，它对公式1损失函数的贡献是

令人拍案叫绝的Wasserstein GAN

令其关于令人拍案叫绝的Wasserstein GAN 的导数为0，得

令人拍案叫绝的Wasserstein GAN

化简得最优判别器为：

令人拍案叫绝的Wasserstein GAN （公式4）

这个结果从直观上很容易理解，就是看一个样本令人拍案叫绝的Wasserstein GAN 来自真实分布和生成分布的可能性的相对比例。如果且，最优判别器就应该非常自信地给出概率0；如果，说明该样本是真是假的可能性刚好一半一半，此时最优判别器也应该给出概率0.5。

然而GAN训练有一个trick，就是别把判别器训练得太好，否则在实验中生成器会完全学不动（loss降不下去），为了探究背后的原因，我们就可以看看在极端情况——判别器最优时，生成器的损失函数变成什么。给公式2加上一个不依赖于生成器的项，使之变成

令人拍案叫绝的Wasserstein GAN

注意，最小化这个损失函数等价于最小化公式2，而且它刚好是判别器损失函数的反。代入最优判别器即公式4，再进行简单的变换可以得到

令人拍案叫绝的Wasserstein GAN

变换成这个样子是为了引入Kullback–Leibler divergence（简称KL散度）和Jensen-Shannon divergence（简称JS散度）这两个重要的相似度衡量指标，后面的主角之一Wasserstein距离，就是要来吊打它们两个的。所以接下来介绍这两个重要的配角——KL散度和JS散度：

令人拍案叫绝的Wasserstein GAN （公式6）

令人拍案叫绝的Wasserstein GAN （公式7）

于是公式5就可以继续写成

令人拍案叫绝的Wasserstein GAN （公式8）

到这里读者可以先喘一口气，看看目前得到了什么结论：根据原始GAN定义的判别器loss，我们可以得到最优判别器的形式；而在最优判别器的下，我们可以把原始GAN定义的生成器loss等价变换为最小化真实分布与生成分布之间的JS散度。我们越训练判别器，它就越接近最优，最小化生成器的loss也就会越近似于最小化和之间的JS散度。

问题就出在这个JS散度上。我们会希望如果两个分布之间越接近它们的JS散度越小，我们通过优化JS散度就能将令人拍案叫绝的Wasserstein GAN “拉向” ，最终以假乱真。这个希望在两个分布有所重叠的时候是成立的，但是如果两个分布完全没有重叠的部分，或者它们重叠的部分可忽略（下面解释什么叫可忽略），它们的JS散度是多少呢？

答案是令人拍案叫绝的Wasserstein GAN ，因为对于任意一个x只有四种可能：

令人拍案叫绝的Wasserstein GAN 且

第一种对计算JS散度无贡献，第二种情况由于重叠部分可忽略所以贡献也为0，第三种情况对公式7右边第一个项的贡献是令人拍案叫绝的Wasserstein GAN ，第四种情况与之类似，所以最终。

换句话说，无论令人拍案叫绝的Wasserstein GAN 跟是远在天边，还是近在眼前，只要它们俩没有一点重叠或者重叠部分可忽略，JS散度就固定是常数， 而这对于梯度下降方法意味着——梯度为0 ！此时对于最优判别器来说，生成器肯定是得不到一丁点梯度信息的；即使对于接近最优的判别器来说，生成器也有很大机会面临梯度消失的问题。

但是令人拍案叫绝的Wasserstein GAN 与不重叠或重叠部分可忽略的可能性有多大？不严谨的答案是：非常大。比较严谨的答案是： 当与的支撑集（support）是高维空间中的低维流形（manifold）时，与重叠部分测度（measure）为0的概率为1。

不用被奇怪的术语吓得关掉页面，虽然论文给出的是严格的数学表述，但是直观上其实很容易理解。首先简单介绍一下这几个概念：

回过头来看第一句话，“当令人拍案叫绝的Wasserstein GAN 与的支撑集是高维空间中的低维流形时”，基本上是成立的。原因是GAN中的生成器一般是从某个低维（比如100维）的随机分布中采样出一个编码向量，再经过一个神经网络生成出一个高维样本（比如64x64的图片就有4096维）。当生成器的参数固定时，生成样本的概率分布虽然是定义在4096维的空间上，但它本身所有可能产生的变化已经被那个100维的随机分布限定了，其本质维度就是100，再考虑到神经网络带来的映射降维，最终可能比100还小，所以生成样本分布的支撑集就在4096维空间中构成一个最多100维的低维流形，“撑不满”整个高维空间。

“撑不满”就会导致真实分布与生成分布难以“碰到面”，这很容易在二维空间中理解：一方面，二维平面中随机取两条曲线，它们之间刚好存在重叠线段的概率为0；另一方面，虽然它们很大可能会存在交叉点，但是相比于两条曲线而言，交叉点比曲线低一个维度，长度（测度）为0，可忽略。三维空间中也是类似的，随机取两个曲面，它们之间最多就是比较有可能存在交叉线，但是交叉线比曲面低一个维度，面积（测度）是0，可忽略。从低维空间拓展到高维空间，就有了如下逻辑：因为一开始生成器随机初始化，所以令人拍案叫绝的Wasserstein GAN 几乎不可能与有什么关联，所以它们的支撑集之间的重叠部分要么不存在，要么就比和的最小维度还要低至少一个维度，故而测度为0。所谓“重叠部分测度为0”，就是上文所言“不重叠或者重叠部分可忽略”的意思。

我们就得到了WGAN前作中关于生成器梯度消失的第一个论证：在（近似）最优判别器下，最小化生成器的loss等价于最小化令人拍案叫绝的Wasserstein GAN 与之间的JS散度，而由于与几乎不可能有不可忽略的重叠，所以无论它们相距多远JS散度都是常数，最终导致生成器的梯度（近似）为0，梯度消失。

接着作者写了很多公式定理从第二个角度进行论证，但是背后的思想也可以直观地解释：

首先，令人拍案叫绝的Wasserstein GAN 与之间几乎不可能有不可忽略的重叠，所以无论它们之间的“缝隙”多狭小，都肯定存在一个最优分割曲面把它们隔开，最多就是在那些可忽略的重叠处隔不开而已。

由于判别器作为一个神经网络可以无限拟合这个分隔曲面，所以存在一个最优判别器，对几乎所有真实样本给出概率1，对几乎所有生成样本给出概率0，而那些隔不开的部分就是难以被最优判别器分类的样本，但是它们的测度为0，可忽略。

最优判别器在真实分布和生成分布的支撑集上给出的概率都是常数（1和0），导致生成器的loss梯度为0，梯度消失。

有了这些理论分析，原始GAN不稳定的原因就彻底清楚了：判别器训练得太好，生成器梯度消失，生成器loss降不下去；判别器训练得不好，生成器梯度不准，四处乱跑。只有判别器训练得不好不坏才行，但是这个火候又很难把握，甚至在同一轮训练的前后不同阶段这个火候都可能不一样，所以GAN才那么难训练。

实验辅证如下：

令人拍案叫绝的Wasserstein GAN

第二种原始GAN形式的问题

一句话概括：最小化第二种生成器loss函数，会等价于最小化一个不合理的距离衡量，导致两个问题，一是梯度不稳定，二是collapse mode即多样性不足。 WGAN前作又是从两个角度进行了论证，下面只说第一个角度，因为对于第二个角度我难以找到一个直观的解释方式，感兴趣的读者还是去看论文吧（逃）。

如前文所说，Ian Goodfellow提出的“- log D trick”是把生成器loss改成

令人拍案叫绝的Wasserstein GAN （公式3）

上文推导已经得到在最优判别器令人拍案叫绝的Wasserstein GAN 下

令人拍案叫绝的Wasserstein GAN （公式9）

我们可以把KL散度（注意下面是先g后r）变换成含的形式：

令人拍案叫绝的Wasserstein GAN （公式10）

由公式3，9，10可得最小化目标的等价变形

令人拍案叫绝的Wasserstein GAN

注意上式最后两项不依赖于生成器G，最终得到最小化公式3等价于最小化

令人拍案叫绝的Wasserstein GAN （公式11）

这个等价最小化目标存在两个严重的问题。第一是它同时要最小化生成分布与真实分布的KL散度，却又要最大化两者的JS散度，一个要拉近，一个却要推远！这在直观上非常荒谬，在数值上则会导致梯度不稳定，这是后面那个JS散度项的毛病。

第二，即便是前面那个正常的KL散度项也有毛病。因为KL散度不是一个对称的衡量，令人拍案叫绝的Wasserstein GAN 与是有差别的。以前者为例

换言之，令人拍案叫绝的Wasserstein GAN 对于上面两种错误的惩罚是不一样的，第一种错误对应的是“生成器没能生成真实的样本”，惩罚微小；第二种错误对应的是“生成器生成了不真实的样本” ，惩罚巨大。第一种错误对应的是缺乏多样性，第二种错误对应的是缺乏准确性。这一放一打之下，生成器宁可多生成一些重复但是很“安全”的样本，也不愿意去生成多样性的样本，因为那样一不小心就会产生第二种错误，得不偿失。这种现象就是大家常说的collapse mode。

第一部分小结：在原始GAN的（近似）最优判别器下，第一种生成器loss面临梯度消失问题，第二种生成器loss面临优化目标荒谬、梯度不稳定、对多样性与准确性惩罚不平衡导致mode collapse这几个问题。

实验辅证如下：

令人拍案叫绝的Wasserstein GAN

第二部分：WGAN之前的一个过渡解决方案

原始GAN问题的根源可以归结为两点，一是等价优化的距离衡量（KL散度、JS散度）不合理，二是生成器随机初始化后的生成分布很难与真实分布有不可忽略的重叠。

WGAN前作其实已经针对第二点提出了一个解决方案，就是对生成样本和真实样本加噪声，直观上说，使得原本的两个低维流形“弥散”到整个高维空间，强行让它们产生不可忽略的重叠。而一旦存在重叠，JS散度就能真正发挥作用，此时如果两个分布越靠近，它们“弥散”出来的部分重叠得越多，JS散度也会越小而不会一直是一个常数，于是（在第一种原始GAN形式下）梯度消失的问题就解决了。在训练过程中，我们可以对所加的噪声进行退火（annealing），慢慢减小其方差，到后面两个低维流形“本体”都已经有重叠时，就算把噪声完全拿掉，JS散度也能照样发挥作用，继续产生有意义的梯度把两个低维流形拉近，直到它们接近完全重合。以上是对原文的直观解释。

在这个解决方案下我们可以放心地把判别器训练到接近最优，不必担心梯度消失的问题。而当判别器最优时，对公式9取反可得判别器的最小loss为

令人拍案叫绝的Wasserstein GAN

其中令人拍案叫绝的Wasserstein GAN 和分别是加噪后的真实分布与生成分布。反过来说，从最优判别器的loss可以反推出当前两个加噪分布的JS散度。两个加噪分布的JS散度可以在某种程度上代表两个原本分布的距离，也就是说可以通过最优判别器的loss反映训练进程！……真的有这样的好事吗？

并没有，因为加噪JS散度的具体数值受到噪声的方差影响，随着噪声的退火，前后的数值就没法比较了，所以它不能成为令人拍案叫绝的Wasserstein GAN 和距离的本质性衡量。

因为本文的重点是WGAN本身，所以WGAN前作的加噪方案简单介绍到这里，感兴趣的读者可以阅读原文了解更多细节。加噪方案是针对原始GAN问题的第二点根源提出的，解决了训练不稳定的问题，不需要小心平衡判别器训练的火候，可以放心地把判别器训练到接近最优，但是仍然没能够提供一个衡量训练进程的数值指标。但是WGAN本作就从第一点根源出发，用Wasserstein距离代替JS散度，同时完成了稳定训练和进程指标的问题！

作者未对此方案进行实验验证。

第三部分：Wasserstein距离的优越性质

Wasserstein距离又叫Earth-Mover（EM）距离，定义如下：

令人拍案叫绝的Wasserstein GAN （公式12）

解释如下：令人拍案叫绝的Wasserstein GAN 是和组合起来的所有可能的联合分布的集合，反过来说，中每一个分布的边缘分布都是和。对于每一个可能的联合分布而言，可以从中采样得到一个真实样本和一个生成样本令人拍案叫绝的Wasserstein GAN ，并算出这对样本的距离，所以可以计算该联合分布下样本对距离的期望值。在所有可能的联合分布中能够对这个期望值取到的下界，就定义为Wasserstein距离。

直观上可以把令人拍案叫绝的Wasserstein GAN 理解为在这个“路径规划”下把这堆“沙土”挪到 “位置”所需的“消耗”，而就是“最优路径规划”下的“最小消耗”，所以才叫Earth-Mover（推土机）距离。

Wasserstein距离相比KL散度、JS散度的优越性在于，即便两个分布没有重叠，Wasserstein距离仍然能够反映它们的远近。 WGAN本作通过简单的例子展示了这一点。考虑如下二维空间中的两个分布令人拍案叫绝的Wasserstein GAN 和，在线段AB上均匀分布，在线段CD上均匀分布，通过控制参数可以控制着两个分布的距离远近。

令人拍案叫绝的Wasserstein GAN

此时容易得到（读者可自行验证）

令人拍案叫绝的Wasserstein GAN （突变）

令人拍案叫绝的Wasserstein GAN （平滑）

KL散度和JS散度是突变的，要么最大要么最小， Wasserstein距离却是平滑的 ，如果我们要用梯度下降法优化令人拍案叫绝的Wasserstein GAN 这个参数，前两者根本提供不了梯度，Wasserstein距离却可以。类似地，在高维空间中如果两个分布不重叠或者重叠部分可忽略，则KL和JS既反映不了远近，也提供不了梯度， 但是Wasserstein却可以提供有意义的梯度 。

既然Wasserstein距离有如此优越的性质，如果我们能够把它定义为生成器的loss，不就可以产生有意义的梯度来更新生成器，使得生成分布被拉向真实分布吗？

没那么简单，因为Wasserstein距离定义（公式12）中的令人拍案叫绝的Wasserstein GAN 没法直接求解，不过没关系，作者用了一个已有的定理把它变换为如下形式

令人拍案叫绝的Wasserstein GAN （公式13）

证明过程被作者丢到论文附录中了，我们也姑且不管，先看看上式究竟说了什么。

首先需要介绍一个概念——Lipschitz连续。它其实就是在一个连续函数令人拍案叫绝的Wasserstein GAN 上面额外施加了一个限制，要求存在一个常数使得定义域内的任意两个元素和都满足

令人拍案叫绝的Wasserstein GAN

此时称函数令人拍案叫绝的Wasserstein GAN 的Lipschitz常数为。

简单理解，比如说令人拍案叫绝的Wasserstein GAN 的定义域是实数集合，那上面的要求就等价于的导函数绝对值不超过。再比如说就不是Lipschitz连续，因为它的导函数没有上界。Lipschitz连续条件限制了一个连续函数的最大局部变动幅度。

公式13的意思就是在要求函数令人拍案叫绝的Wasserstein GAN 的Lipschitz常数不超过的条件下，对所有可能满足条件的取到的上界，然后再除以。特别地，我们可以用一组参数来定义一系列可能的函数，此时求解公式13可以近似变成求解如下形式

令人拍案叫绝的Wasserstein GAN （公式14）

再用上我们搞深度学习的人最熟悉的那一套，不就可以把令人拍案叫绝的Wasserstein GAN 用一个带参数的神经网络来表示嘛！由于神经网络的拟合能力足够强大，我们有理由相信，这样定义出来的一系列虽然无法囊括所有可能，但是也足以高度近似公式13要求的那个了。

最后，还不能忘了满足公式14中令人拍案叫绝的Wasserstein GAN 这个限制。我们其实不关心具体的K是多少，只要它不是正无穷就行，因为它只是会使得梯度变大倍，并不会影响梯度的方向。所以作者采取了一个非常简单的做法，就是限制神经网络的所有参数令人拍案叫绝的Wasserstein GAN 的不超过某个范围，比如，此时所有偏导数也不会超过某个范围，所以一定存在某个不知道的常数使得的局部变动幅度不会超过它，Lipschitz连续条件得以满足。具体在算法实现中，只需要每次更新完令人拍案叫绝的Wasserstein GAN 后把它clip回这个范围就可以了。

到此为止，我们可以构造一个含参数、最后一层不是非线性激活层的判别器网络，在限制不超过某个范围的条件下，使得

（公式15）

尽可能取到最大，此时就会近似真实分布与生成分布之间的Wasserstein距离（忽略常数倍数）。注意原始GAN的判别器做的是真假二分类任务，所以最后一层是sigmoid，但是现在WGAN中的判别器做的是近似拟合Wasserstein距离，属于回归任务，所以要把最后一层的sigmoid拿掉。

接下来生成器要近似地最小化Wasserstein距离，可以最小化，由于Wasserstein距离的优良性质，我们不需要担心生成器梯度消失的问题。再考虑到的第一项与生成器无关，就得到了WGAN的两个loss。

令人拍案叫绝的Wasserstein GAN （公式16，WGAN生成器loss函数）

令人拍案叫绝的Wasserstein GAN （公式17，WGAN判别器loss函数）

公式15是公式17的反，可以指示训练进程，其数值越小，表示真实分布与生成分布的Wasserstein距离越小，GAN训练得越好。

WGAN完整的算法流程已经贴过了，为了方便读者此处再贴一遍：

令人拍案叫绝的Wasserstein GAN

上文说过，WGAN与原始GAN第一种形式相比，只改了四点：

前三点都是从理论分析中得到的，已经介绍完毕；第四点却是作者从实验中发现的，属于trick，相对比较“玄”。作者发现如果使用Adam，判别器的loss有时候会崩掉，当它崩掉时，Adam给出的更新方向与梯度方向夹角的cos值就变成负数，更新方向与梯度方向南辕北辙，这意味着判别器的loss梯度是不稳定的，所以不适合用Adam这类基于动量的优化算法。作者改用RMSProp之后，问题就解决了，因为RMSProp适合梯度不稳定的情况。

对WGAN作者做了不少实验验证，本文只提比较重要的两点。第一，判别器所近似的Wasserstein距离与生成器的生成图片质量高度相关，如下所示（此即题图）：

令人拍案叫绝的Wasserstein GAN

第二，WGAN如果用类似DCGAN架构，生成图片的效果与DCGAN差不多：

令人拍案叫绝的Wasserstein GAN

但是厉害的地方在于WGAN不用DCGAN各种特殊的架构设计也能做到不错的效果，比如如果大家一起拿掉Batch Normalization的话，DCGAN就崩了：

令人拍案叫绝的Wasserstein GAN

如果WGAN和原始GAN都使用多层全连接网络（MLP），不用CNN，WGAN质量会变差些，但是原始GAN不仅质量变得更差，而且还出现了collapse mode，即多样性不足：

令人拍案叫绝的Wasserstein GAN

最后补充一点论文没提到，但是我个人觉得比较微妙的问题。判别器所近似的Wasserstein距离能够用来指示单次训练中的训练进程，这个没错；接着作者又说它可以用于比较多次训练进程，指引调参，我倒是觉得需要小心些。比如说我下次训练时改了判别器的层数、节点数等超参，判别器的拟合能力就必然有所波动，再比如说我下次训练时改了生成器两次迭代之间，判别器的迭代次数，这两种常见的变动都会使得Wasserstein距离的拟合误差就与上次不一样。那么这个拟合误差的变动究竟有多大，或者说不同的人做实验时判别器的拟合能力或迭代次数相差实在太大，那它们之间还能不能直接比较上述指标，我都是存疑的。

WGAN前作分析了Ian Goodfellow提出的原始GAN两种形式各自的问题，第一种形式等价在最优判别器下等价于最小化生成分布与真实分布之间的JS散度，由于随机生成分布很难与真实分布有不可忽略的重叠以及JS散度的突变特性，使得生成器面临梯度消失的问题；第二种形式在最优判别器下等价于既要最小化生成分布与真实分布直接的KL散度，又要最大化其JS散度，相互矛盾，导致梯度不稳定，而且KL散度的不对称性使得生成器宁可丧失多样性也不愿丧失准确性，导致collapse mode现象。

WGAN前作针对分布重叠问题提出了一个过渡解决方案，通过对生成样本和真实样本加噪声使得两个分布产生重叠，理论上可以解决训练不稳定的问题，可以放心训练判别器到接近最优，但是未能提供一个指示训练进程的可靠指标，也未做实验验证。

WGAN本作引入了Wasserstein距离，由于它相对KL散度与JS散度具有优越的平滑特性，理论上可以解决梯度消失问题。接着通过数学变换将Wasserstein距离写成可求解的形式，利用一个参数数值范围受限的判别器神经网络来最大化这个形式，就可以近似Wasserstein距离。在此近似最优判别器下优化生成器使得Wasserstein距离缩小，就能有效拉近生成分布与真实分布。WGAN既解决了训练不稳定的问题，也提供了一个可靠的训练进程指标，而且该指标确实与生成样本的质量高度相关。作者对WGAN进行了实验验证。

纵览深度学习技术前沿，Yoshua Bengio为你解读如何创造人类水平的AI（附PPT）

Google首席科学家Vincent Vanhoucke：机器人和深度学习正在发生一些“有趣的融合”| AAAI 2017

版权文章，未经授权禁止转载。详情见转载须知。

令人拍案叫绝的Wasserstein GAN

谷普下载提醒您

本文链接：http://www.gpxz.com/article/470c58176b1904289ea1.html

上一篇：在近段时间又有哪些研究进展掀起热潮的Wass

下一篇：与李沐师徒官宣创业Alex入大模型舍亚马逊Sm

- 购物 - 电商服务网址大全--123网址之家

-购物-电商服务网址

网址导航 2023-12-12 19:31:48

北京博朗宁科技有限公司

北京博朗宁科技有限公司是优质的wika压力变送器,德国威卡压力表,德国威卡压力变送器,hamilton进样针,hamilton电极供应商，主要经营产品有：wika压力变送器,德国威卡压力表,德国威卡压力变送器,hamilton进样针,hamilton电极！

科技创新 2024-08-16 23:22:43

w3cschool官网

w3cschool启用中文品牌名--编程狮，是一个专业的W3C前端开发及编程入门学习平台，提供包括HTML,CSS,Javascript,jQuery,C,PHP,Java,Python,Sql,Mysql等编程语言和开源技术的在线教程及使用手册，是类国外w3schools的W3C学习社区及菜鸟编程平台。

编程开发 2024-08-17 00:51:07

人民网

人民网，是世界十大报纸之一《人民日报》建设的以新闻为主的大型网上信息发布平台，也是互联网上最大的中文和多语种新闻网站之一。作为国家重点新闻网站，人民网以新闻报道的权威性、及时性、多样性和评论性为特色，在网民中树立起了“权威媒体、大众网站”的形象。

游戏网游 2024-07-11 13:28:13

国产PLC

联诚科技集团股份有限公司是一家专业从事国产PLC控制器生产的厂家,专注高品质PLC控制器研发生产销售。作为国产PLC品牌之一，我们提供全面的自动化控制解决方案，助力工业智能化升级。

企业品牌 2024-11-13 06:36:36

深圳建筑效果图

深圳建筑效果图，长沙效果图制作，广州景观效果图，武汉规划效果图，上海室内效果图，3D数字动画渲染

电影视频 2024-11-13 08:57:32

LVK475

龙维新电是一家专注于高安全、高效率、高科技的数字配电柜生产商，主营产品有LVK475,小体积配电柜,抽屉式电容柜,数字配电柜,数字电容柜,宽带电力载波多功能表,宽带电力载波表,宽带载波多功能表等，公司拥有二十多个发明专利和实用新型专利。

安全杀毒 2024-11-13 22:43:31

住呗官网

敢承诺！敢保障！装修优选博若森

房产装修 2024-11-19 19:27:50

安总科技集团

安总科技集团成立于2015年，是致力于气凝胶新材料研发及其衍生品应用的国家高新技术企业，系安华新材料产业研究院（江苏）有限公司的全资子公司。

网络应用 2024-12-03 22:22:14

甘肃居立门业

甘肃居立门业有限责任公司是西北五省规模大、设备模具全的防盗门生产基地，是集各类门业研发、设计、生产、销售、服务为一体的现代化企业。

设计美化 2024-12-05 18:26:39

上海众帆国际物流有限公司

我们上海众帆国际物流有限公司是无船承运人（NVOCC）之一、编号：NG190605-00011，也是国际货运代理协会（FIATA）成员之一，本公司专业经营国际运输业务，向海内外客户提供海、陆、空进出口货物运输服务，包括订舱、配载、报关、仓储、提运、保险以及多项物流服务。

商业服务 2025-01-15 18:05:37

秦皇岛吉泰生物科技研究所

吉泰生物从事干细胞临床科研及临床转化十余年，始终致力于干细胞生命健康产业布局（细胞生物学、干细胞生命科学与人类健康、干细胞临床技术应用、再生医学、生物技术服务）

网络应用 2025-02-04 23:29:08

2024高人气找茬手游盘点有没有找茬小游戏 (2024高分电影排行榜最新)

在无聊时刻，很多人总会选择一款普通的休闲游戏从中获得无限欢乐，很多人对简单又治的找茬小游戏很喜欢，不仅能锻炼大家的观察能力，也非常锻炼脑力以及眼力，今天小编为大家推荐几款，其中有沉浸式关卡以及灵动的音效，精致的视听效果，老少皆宜，男女老少都特别喜欢的找茬手游，这款益智游戏适合不同年龄段，游戏当中的图片非常精致，最重要的是所有图片都以绿...。

2025-02-11 15:00:00

医疗 AI 科大讯飞智慧医疗事业部空降领头人战略深度解析讯飞 (医科大学a)

今日，科大讯飞官方宣布引入智慧医疗领域顶级人才陶晓东博士，加入讯飞高管团队，担任科大讯飞智慧医疗事业部总经理一职，进一步开拓AI，医疗市场，陶晓东的研究方向为医学影像，是美国约翰霍普金斯大学博士，电子电气工程师学会，IEEE，高级会员，曾服务于美国通用电气公司，GE，从事医学影像研究，并在飞利浦医疗放射解决方案担任首席架构师，2017...。

2024-11-30 20:29:22

如何成为优秀的智能办公投影仪坚果L2X评测 (如何成为优秀党员)

发表在坚果投影仪2018，12，316，36我在家里收到包裹的前几天！我取消装箱，发现了一台令人惊叹的投影机，这篇文章是基于我对坚果L2X智能办公投影仪的评论，继续阅读，以了解更多关于我如何了解投影机和我使用相同的经验！我什么时候第一次看到坚果L2X智能办公投影仪，首先，我想澄清一件我没有购买投影机的事情！这是一个无意识的事实，投影仪...。

2024-11-29 00:39:32

投影仪幕布大小有限制吗?投影仪幕布大小选择和什么有关 (投影仪幕布大小)

发表在综合交流大区2024，7，2911，05投影幕布对投影画面主要起到提升画面效果的作用，那么投影仪幕布大小有限制吗，投影仪幕布大小选择和什么有关，下面就来详细了解一下，看看投影幕布大小受什么影响，一、投影仪幕布大小有限制吗答案是有限制的，投影仪幕布受到投影仪的投影距离和投射比、观看距离和空间大小、投影仪的分辨率和亮度、幕布的材质和...。

2024-11-28 19:21:58

传递亲情的治愈力气将上线妹妹有哥在伊能静张亮 (传递亲情的治愈句子)

网易文娱3月16日报道从儿时的玩伴，我爱哥哥、哥哥是我的超人，，到中年互为依仗，对方有事第一律念必定要帮，再到老年的回望，哥哥是我的兄长，是我的教员，同时也像父亲一样、哥哥就是娘家，，虽然不同兄妹相处方式天壤之别，却都诠释了爱与亲情的容貌，近日，，妹妹有哥在，颁布的，幸亏有你陪我长大，主题短片中，不同年龄段的兄妹分享了他们的好受亲情故...。

2024-09-07 20:19:57

20多万起售的奢侈入门SUV！新款奥迪Q2L值不值 (售价20万左右有什么车)

假设说要花20多万买一台奢侈车，大家会怎样选，放在几年前，预计大多会思考一台合资品牌的中型轿车，而关于如今谋求时兴、质量生存的年轻人来说，奢侈品牌的入门级SUV会是一个不错的选用，比如奥迪旗下的入门SUV车型，奥迪Q2L，日前，一汽，公众2021款奥迪Q2L正式上市，以下简称，新款奥迪Q2L，，共推出5款车型，售价区间为21.88，2...。

2024-07-07 12:38:50

圆梦汽车为什么迟迟不上市呢 (圆梦汽车为什么不上市)

圆梦汽车迟迟不上市是由于以下要素，供应链世界弛缓，锂资料涨价，而受疫情影响，国际供应链复产还须要期间顺应，厂家老本高，且供应无余，且汽车上市还须要经过测试，测试也须要期间，影响汽车上市的要素有，消费方面供应和制造以及消费资金，市场方面受疫情影响各方面阻力较大，作为自主四大奢侈品牌之一，WEY牌的销量可谓日渐式微，与领克、红旗的差距越拉...。

2024-07-06 19:47:37

欧拉iq头顶上的灯怎样关 (欧拉iq头顶上的灯怎么关)

1、拨动开关，假设开关处于封锁位置，灯依然亮着，或者是开关没有到位，你须要把开关转到开的位置，而后把开关转到关的位置，2、把门关紧，假设车顶灯处于车门形式，或者是车主没无关紧车门，司机须要翻开车门再翻开，车顶灯就灭了，3、从主驾驶门进来，假设驾驶员在车辆熄火后从主驾驶座车门以外的车门进来，用车钥匙锁车，车顶灯不会封锁，欧拉iq方向盘左...。

2024-07-06 19:31:48

网传女律师闭庭时遭逢法警暴力执法贵阳市云岩区法院不分明此事 (女律师被害最新进展)

7月2日，有律师发文称，在贵阳市云岩区法院闭庭时，遭逢法警暴力执法，当日下午，贵阳市云岩区法院上班人员回应奔腾资讯时称，不分明此事，视频截图北京市汉鼎联结律师事务所何智娟律师发文称，7月1日，郑晓辉、孙健等四人涉嫌巧取豪夺罪一案在贵阳市云岩区法院闭庭，她与多名律师出庭辩护，第一天闭庭，她们就检察机关倡导法庭延期审理补充侦察后，对有无依...。

2024-07-04 17:02:41

1688客服,1688客服可以跟淘宝聊天吗?

1688客服工作时间1688客服工作时间为9:0018:00。1688客服我不回消息怎么办？1688打电话给我说好客服1688打电话给我说好客服，然后问他什么事客服？1688客服打电话说要自动扣商家钱是假的，1688of客服你能和淘宝聊天吗1688of客服你能和淘宝聊天吗，CustomerService主要体现了一种以客户满意为导向的价值观，是一种事前的整合和管理。1、1688投诉店家小二客服的电话会不会是私人手机不会的。投诉方式:1。拨打阿里巴巴客服热线进行投诉。进行人工投诉反馈。2.在官网投诉。搜索[

2023-10-11 01:42:01

饿了么免单一分钟7.6答案是什么饿了么免单7.6答案解析

饿了么免单一分钟7.6终于来到了程序员专场啦~很多计算机专业的小伙伴看到饿了么免单7.6的题目都非常兴奋，纷纷表示终于是程序员的专场了。那么饿了么免单一分钟7.6答案是什么呢？下面给大家提供几种比较准确的饿了么免单7.6答案预测分析。,饿了么免单一分钟7.6答案是什么饿了么免单7.6答案解析

2023-08-11 17:11:35

文章推荐

一个小米黄牛发家自述三年赚千万 (小米黄牛多)

导语，作为小米第一代，大黄牛，，老娄从2012年2月开始从线下渠道分销小米手机，最高月销量超过7万台，经过两年半时间，个人资产积累已超过千万元，一个小米黄牛发家自述，三年赚千万在深圳，笔者有幸结识了小米在华南区域主要的，黄牛，之一，老娄，化名，作为小米第一代，大黄牛，，老娄从2012年2月开始从线下渠道分销小米手机，最高月销量超过...。

2025-01-30 23:32:54

网络百科

话费流量费咋不降? 网友三大运营商日赚3.8亿 (流量在话费中怎么扣)

随着中国电信2015年业绩出炉，至此，三大电信运营商2015年财报已经全部发布，其中电信净利润200.54亿元，比去年增长13.4%，移动利润为1085亿元，同比下降0.6%，联通净利润105.6亿元，同比下降12.4%，中国电信成为三大运营商中唯一净利正增长的企业，综合来看，三大电信运营商去年合计共赚约1391亿元，算下来日均3.8...。

2025-01-30 23:12:39

网络百科

高亮度才是王道商务投影机就该这么选 (你知道高亮度)

shenzuoman大神级投影控发表于2023，08，17商务投影机在工作场景中发挥的作用越来越大，对于一些企业、学校和机构来说，商务投影机的选购相当重要，下面从高亮度、分辨率、投影距离、灯泡寿命、投影功率等方面探讨商务投影机怎么选购，1.高亮度商务投影机需要具备足够的亮度，以保证在环境比较亮的情况下，投影画面仍然清晰可见，一般情况下...。

2024-11-29 01:40:26

网络百科

投影机故障维修 (投影机故障维修200例)

发表在投影仪维修2018，11，1917，581、维修前的准备投影机集光、电、机械为一体，电路复杂，所以对维修人员要求较为严格，在维修前应对投影机的工作原理作系统的学习，对待修机的参数，功能等也要了解，最好找到同型号或同厂家的使用手册或电路图作参考，切勿在一无所知的情况下进行维修，2、维修工具，材料的配备应具备宽带示波器、数字万用表、...。

2024-11-28 17:16:19

网络百科

支付养老金的最低缴费年限从15年逐渐提高至20年突出两方面政策 (支付养老金的钱被存在)

人力资源社会保证部副部长李忠13日在十四届全国人大常委会第十一次性会议专题资讯颁布会上说，随着法定退休年龄的提早，按月支付养老金的最低缴费年限也相应作了调整，从目前的15年逐渐提高至20年，综合思考各方面状况，方法突出了以下两个方面的政策，一是设立5年缓冲期，提高最低缴费年限从2030年开局实施，也就是说，在2025年到2029年时期...。

2024-11-13 08:36:02

网络百科

GAN 令人拍案叫绝的Wasserstein (令人拍案)

第一部分：原始GAN究竟出了什么问题？

第一种原始GAN形式的问题

第二种原始GAN形式的问题

第二部分：WGAN之前的一个过渡解决方案

第三部分：Wasserstein距离的优越性质

相关文章

文章推荐