×

生成对抗网络及其在图像生成中的应用研究综述(中文版),23页pdf

hqy hqy 发表于2025-02-28 16:00:47 浏览6 评论0百度已收录

抢沙发发表评论

生成对抗网络(GAN)是无监督学习领域最近几年快速发展的一个研究方向,其主要特点是能够以一种间接的方 式对一个未知分布进行建模。在计算机视觉研究领域中,生成对抗网络有着广泛的应用,特别是在图像生成方面,与其他的 生成模型相比,生成对抗网络不仅可以避免复杂的计算,而且生成的图像质量也更好。因此,本文将对生成对抗网络及其在 图像生成中的研究进展做一个小结和分析;本文首先从模型的架构、目标函数的设计、生成对抗网络在训练中存在的问题, 以及如何处理模式崩溃问题等角度对生成对抗网络进行一个详细的总结和归纳;其次介绍生成对抗网络在图像生成中的两 种方法;随后对一些典型的、用来评估生成图像质量和多样性的方法进行小结;并且对基于图像生成的应用进行详细分析;最后对生成对抗网络和图像生成进行总结,同时对其发展趋势进行一个展望。

生成模型是无监督学习任务中一类重要的方法。生成模型可以直接学习样本数据中的分布,然后从 学到的分布中进行采样可以得到类似于样本数据、 服从同一分布的样本。伴随着深度神经网络的快速 发展,基于神经网络的生成模型取得了显著的成 果。在神经网络兴起之前,生成模型主要是对数据 的分布进行显式的建模,例如:基于有向图模型的 赫姆霍兹机[1(] Helmholtz machines)、变分自动编码 器(Variational Auto-Encoder,VAE)[2]、深度信念 网络[3](Deep belief network, DBN)等和基于无向图 模型的受限玻尔兹曼机[4](Restricted Boltzmann machines, RBM )、 深 度 玻 尔 兹 曼 机 [5] ( Deep Boltzmann machines, DBM)等,以及自回归模型[6] (AR 模型)。由于被建模随机变量的高维度,学习十分困难。其主要体现在统计上的挑战和计算上的 挑战,统计上的挑战就是这些生成模型不能很好的 泛化生成的结果,计算上的挑战主要来自于执行难 解的推断和归一化的分布。面对这些难以处理的计 算,一种方法就是近似它们;另一种方法就是通过 设计模型,完全避免这些难以处理的计算。基于这 样的想法,研究者们提出了一系列新的模型,而由 Goodfellow 等人(2014)提出的生成对抗网络[7] (Generative adversarial networks, GAN)是生成模 型目前最好的一种方法。

受博弈论中两人零和博弈思想的启发,GAN 主 要由生成器和鉴别器两个部分组成。生成器的目的 是生成真实的样本去骗过鉴别器,而鉴别器是去区 分真实的样本和生成的样本。通过对抗训练来不断 的提高各自的能力,最终达到一个纳什均衡的状 态。因为生成对抗网络在生成图像方面的能力超过 了其他的方法,所以其成为了一个热门的研究方向。GAN 中的对抗学习思想逐渐与深度学习中的其 他研究方向相互渗透,从而诞生了很多新的研究方 向和应用。相关综述性的文章包括:生成对抗网络 教程[8](2016 NIPS)、Creswell[9]等人的生成对抗网 络综述、Kurach[10]等人从损失函数、神经网络架构、 正则化和归一化等角度做的综述、林懿伦[11]等人的 生成式对抗网络、Zamorski[12]等人的生成对抗网络 的最新进展。从这些文章中可以看出,关于生成对 抗网络的研究主要是以下两个方面: 

1)在理论研究方面,主要的工作是消除生成对 抗网络的不稳定性和模式崩溃的问题;Goodfellow 在 NIPS 2016 会议期间做的一个关于 GAN 的报告 中[8],他阐述了生成模型的重要性,并且解释了生 成对抗网络如何工作以及一些前沿的话题。Creswell 等人[9] 在生成对抗网络的综述中,主要介 绍了几种 GAN 的网络架构和 GAN 的应用,并且从 信号处理的角度,除了确定训练和构造 GAN 的方 法,还指出了在 GAN 的理论和实际应用中仍然存 在的挑战。Kurach 等人[10]从损失函数、网络架构、 正则化以及批标准化等角度对 GAN 的一些问题和 可重复性进行了研究。林懿伦[11]等人对 GAN 常见的 网络结构、训练方法、集成方法、以及一些应用场 景进行了介绍。Maciej Zamorski 等人[12]从学习隐空 间表示的角度出发,对 GAN 最新的进展进行论述。

(2)在应用方面,主要关注的是生成对抗网络在 计算机视觉(CV)、自然语言处理(NLP)和其他领 域的应用;目前生成对抗网络在计算机视觉任务中 已经有了很多的应用,例如:图像生成、语义分割、 图像编辑、超分辨率、图像修复、域转换、视频生 成和预测等;而生成对抗网络在自然语言处理中的 应用也呈现日益增长的趋势,例如:从文本生成图 像、字体的生成、对话生成、机器翻译等;同时生 成对抗网络在语音生成方面也有一定应用。生成对 抗网络在视觉中的应用情况如表 1 所示。在生成对 抗网络的众多应用中,被研究最多的领域是图像生 成,其目标是通过生成器来生成期望的图像。

本文首先介绍生成对抗网络的基本原理和存在 的问题,以及针对存在问题做的改进。其次对生成 对抗网络在图像生成中应用,以及对生成图像的质 量的评估进行探讨。并且对基于图像生成的应用做 一个详细介绍。最后对生成对抗网络的发展趋势和 其在图像生成领域中的应用进行展望。

专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

后台回复“GAN23” 可以获取《生成对抗网络及其在图像生成中的应用研究综述》专知下载链接索引

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询点击“阅读原文”,了解使用专知,查看获取5000+AI主题知识资源