基于深度对抗网络学习的人脸多风格样本生成研究开题报告

 2022-01-09 10:01

全文总字数:2960字

1. 研究目的与意义及国内外研究现状

对于人工智能的研究,gan(generative adversarial nets)生成对抗网络毫无疑问成了近几年研究的热点,它是由2014年还在蒙特利尔读博士的iangoodfellow引入深度学习领域的。2016年,gan热潮席卷ai领域顶级会议,从iclr到nips,大量高质量论文被发表和探讨,甚至在iclr会议上占据了半壁江山。yann lecun曾评价gan是“20年来机器学习领域最酷的想法。“

与贝叶斯学习不同,神经网络无法或者很难做数据生成,也就是给定一个类别,生成对应类别的数据。所以gan的出现,很大程度上解决了神经网络的生成问题。对于机器学习研究员来说,看待的最关键一点应该是gan可以用来 拟合数据分布 。即gan模型的特点在于,他生成数据本身。

而本次毕业设计所选的题目”基于gan的人脸多风格样本生成研究“,是在有限的样本集训练中,输入人脸正像数据样本,通过g与d的训练过程(实际上是一种博弈过程),在学习从随机变量zz到训练样本xx的映射关系,其中随机变量可以选择服从正太分布,得到一个由多层感知机组成的生成网络g(z;θg)g(z;θg),网络的输入是一个一维的随机变量(人脸正像),输出人脸侧像图片。本设计可以生成大量不同人的人侧脸图像,将有效改善人脸识别领域数据缺乏的问题,最终的测试过程,输入一张随机人正脸的图片,经过训练好的编码器得到身份信息特征,再通过训练好的生成网络,得到同一个人的侧面人脸图像。

国内外研究现状

gan启发自博弈论中的二人零和博弈,由[goodfellow et al, nips 2014]开创性地提出,包含一个生成模型(generative model g)和一个判别模型(discriminative model d)。生成模型捕捉样本数据的分布,判别模型是一个二分类器,判别输入是真实数据还是生成的样本。这个模型的优化过程是一个“二元极小极大博弈(minimax two-player game)”问题,训练时固定一方,更新另一个模型的参数,交替迭代,使得对方的错误最大化,最终,g 能估测出样本数据的分布。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容

基于gan的人脸多风格样本生成研究构建方法和过程:

采用双通道网络(two pathway generator) localpathway和globalpathway. local pathway 用于解决人脸的细节问题,输入正脸的四个特征图像块:两个眼睛、鼻子、嘴巴。输出侧脸的对应四个图像块;global pathway 用于生产人脸大的结构,缺少细节,输入完整的正脸图像输出完整的模糊的测脸图像。主要定义了三个损失函数(synthesis loss function)

1 pixel-wise loss facilitatemulti-scale image content consistency。图像内容的一致性

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 实施方案、进度安排及预期效果

实行方案:基于python的gan人脸多风格样本生成研究:系统由一个生成器和一个判别器构成,生成器捕捉真实样本的潜在分布,并生成新的数据样本;判别器判别输出的是真实数据还是生成的样本,在大量训练后实现“纳什均衡”最后,在系统整合阶段一方面检查已经实现部分的不足,另一方面优化实现部分的代码。

进度:

2018年1月6日至2018年1月14日 开题报告撰写

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献

[1]张卫,马丽,黄金.基于生成式对抗网络的人脸识别开发[j].电子世界,2017(20):164-165.

[2]平行机器人与平行无人系统:框架、结构、过程、平台及其应用[j]. 白天翔,王帅,沈震,曹东璞,郑南宁,王飞跃.自动化学报. 2017(02)

[3] beyondface rotation: global and local perception gan for photorealistic and identity preserving frontal view synthesis.

剩余内容已隐藏,您需要先支付 5元 才能查看该篇文章全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。