基于全卷积网络的人脸分割开题报告
2022-01-11 05:01
全文总字数:3877字
1. 研究目的与意义及国内外研究现状
face parsing是进行人脸识别的一个关键步骤,只有明确的分割出所需要的人脸区域,才能进行有关的下一步操作。face parsing之后的图像不仅能应用于人脸识别,还可以在化妆技术和脸谱变换等技术上进行运用,所以face parsing便成为当代满足人们需求的一个重要基础。
物体分类是计算机视觉的一大重要研究方向,其目的是对图片整体进行分类。而当我们想进一步对图片的局部进行分类时,便需要进行物体检测。当我们想更进一步,对图片中的每个像素进行分类时,我们便进入了一个更加细致的领域,那就是像素级的语义分割,这会使得图片中的每个像素都标上对应的类别。到此,我们能够知道,从物体分类到物体检测,再到语义分割,任务的粒度越来越细。本论文中所要介绍的主要内容便是三者中最为细致的语义分割。对于face parsing而言,它作为像素级语义理解的一个方面而存在,在计算机视觉的世界中,赋予了机器对人脸进行换妆的能力,其通过细粒度分割的方式,将面部的不同区域在像素级剥离开来,从而将换妆的过程简化为寥寥数笔。根据face parsing的结果,我们可以将指定的美妆产品应用于图片,最终得到美妆的结果。具体来说,在得到face parsing结果后我们将选择的化妆产品应用于相应的区域。有了这一系统,我们可以在不用手动化妆、卸妆的情况下尝试不同的妆容效果。
通过face parsing,不仅可以在智能美妆上发挥作用,还能够在妆容迁移和人脸老化这两个工作上一展拳脚。
2. 研究的基本内容
本论文中的face parsing基于全卷积网络(简称fcn),fcn对图像进行像素级分类,从而解决了语义级别的face parsing问题。
与经典的cnn相比,在卷积层之后使用全连接层得到固定长度的特征向量进行分类不同,fcn可以接受任意尺寸的输入图像,采用反卷积层对最后一个卷积层的特征图进行上采样, 使它恢复到与输入图像相同的尺寸,从而可以对每个像素都产生一个预测。
同时fcn保留了原始输入图像中的空间信息, 在上采样的特征图上进行像素分类。
3. 实施方案、进度安排及预期效果
实施方案:利用caffe框架进行fcn的测试和训练,从网络找到人脸相关的database,编程语言运用python和matlab,利用caffe与这两个软件产生接口,并在服务器上进行训练,以此来进行实验。
进度方案:先进行相关基础知识的了解和学习,然后熟悉caffe的结构框架,查阅相关fcn训练和测试教程,查找较为合适的人脸数据集,结合自身的实际情况来进行毕业设计。
预期效果:首先顺利进行caffe的编译,与python和matlab产生接口,然后,顺利的在windows下进行数据集的训练,最后,能够较好地对人脸图像进行分割。
4. 参考文献
[2]周志华.机器学习[m].北京: 清华大学出版社, 2016.
[3]zhen wei,yao sun,jinqiao wang,hanjiang lai,si liu.learning adaptive receptive fields for deep image parsing network[j].in ieee conference on computer vision and pattern recognition,cvpr 2017,pages 3947-3955,2017.
最新文档
- 现代风险导向审计模式下企业内部审计研究外文翻译资料
- 数字地图:一个WiFi法医定位工具外文翻译资料
- 基于PHP的Web应用程序的面向切面开发外文翻译资料
- 芳香化合物的分子复杂性:对苯醌单缩酮和结构修饰 的对本苯醌单缩酮的化学研究进展外文翻译资料
- 产品伤害危机管理中的隐性危机’外文翻译资料
- 论跨境电子商务的发展与外贸模式的转变外文翻译资料
- 弯曲构件的强度外文翻译资料
- 大股东和独立董事的股权补偿外文翻译资料
- 货币政策收紧,会计信息可比性和投资不足:来自中国的证据外文翻译资料
- 光热作用增强石墨烯基纳米复合材料的光 催化性能外文翻译资料
- 加强信息咨询的途径外文翻译资料
- 偏高岭土和石灰石复掺对水泥水化性能的协同效应外文翻译资料
- 室内定位使用调频信号外文翻译资料
- 竞争优势外文翻译资料
- 钢筋混凝土结构中的扭曲通常源于构件之间的连续性外文翻译资料