基于Python的人脸表情分类开题报告

2020-07-19 18:43:57

1. 研究目的与意义（文献综述包含参考文献）

毕业设计（论文）开题报告

1．结合毕业设计（论文）课题情况，根据所查阅的文献资料，每人撰写

2000字左右的文献综述：

文献综述

1.引言

科技的不断发展，人工智能的研究已经达到了很高的水平，然而,它的研究目的只是在于模拟人的智能, 如判断、推理、证明等思维活动。人工心理理论^[1]则是利用信息科学的方法,对人的心理活动的更全面内容的再一次人工机器(计算机、模型算法等)实现。人工心理理论在机器人的技术支持、基于PLC的人工智能产品^[2,3]、人性化商品设计、人机和谐多通道接口有着很大的作用。在本文中我们采用人脸表情进行识别，通过计算机对数据的处理得知人们的内心活动。计算机和机器人如果能够象人类那样具有理解和表达情感的能力, 并能够自主适应环境, 这将从根本上改变人与计算机之间的关系, 使计算机能够更好的为人类服务。

2.数据库的建立

多数的情感分析基于Ekman^[4]的研究，在实验过程中首先确定数据库中应该收集哪些样本，样本之间有些什么差异，怎么分类。在本次实验中对人脸表情研究的问题空间，在数据库中将考虑该问题空间的如下几个因素：描述的层次，拍摄的角度，个体的差异。其中最重要的是确定描述层次。人脸表情有很多种描述方法，PIE数据库按光照^[5]、姿态和表情来描述样本。Cohn-kanade人脸表情数据库按照动作单元描述样本。在该数据库中，将表情分类为情感类表情和说话类表情。在本文中研究情感类表情。摄像机的光照和拍摄角度以及摄像机硬件的配置需要一定的要求。同时摄像机需要从三个不同的角度对同一表情进行拍摄，再经过摄像机的内外标定得取投影之后的数据进行储存（排除一些误差较大的数据）^[6]。

数据库选取有4种方法：第一个数据库是Cohn-Kanade AU^[7]编码的人脸表情数据库。在图像分析和合成方面有很大作用。它将每个序列的目标表达式都完全由FACS编码。并将已验证的情感标签已添加到元数据中。因此，可以对动作单元和原型情绪进行序列分析。第二个数据库是来自慕尼黑技术大学的带有面部表情和情绪的FEED数据库，数据库中定义了六种不同的基本情绪^[8]。从不同的人选取不同的表情并记录。总而言之，这给出了399个序列的数量。第三个数据库是OuluCASIA面部表情数据库^[9]。这个数据库是由奥卢大学机器视觉小组开发的，该小组由来自不同年龄的六个典型表情（惊喜，快乐，悲伤，愤怒，恐惧和厌恶）组成。要求受试者根据给定序列中所示的表达实例（活动的面部表情）进行面部表情。最后，第四个数据库是RMLemotion数据库，从媒体实验室收集的60个（每个情绪十个）自发视听情绪表达样本^[10]。表达了六种基本的人类情感：愤怒，厌恶，恐惧，幸福，悲伤，惊奇。RML情绪数据库适用于基于音频，基于静态图像以及基于视频的二维和三维动态分析和识别。

3.人脸识别原理

识别的方法有多种，其中存在映射方法^[11],但不是经常使用。对于采集下来的图像进行解析，将人的脸部分为多部分区域，并将多种区域中划分成多个点^[12]，分别对微笑、悲伤、惊恐等六种基础表情做解析，检测眼部、鼻子、眉毛、嘴巴、练的轮廓对表情的影响大小，通过信噪比SNR的大小进行排序，选取最优的位置对表情进行解析。通过对人脸表情的采样，将其数据投影与数据库的数据中，进行比较和归一化处理，通过协方差和平均值等计算出估计值误差，再通过运用优化技术得出最优结果。实验过程中，采集一个人的静态表情，并将其化为几十个点，投影与数据库的数据，计算机通过一定的算法得以偏差和平均值，并确定数据的合理性。根据SNR的优先顺序^[13]对几十个点进行分析，从而得以最优的数据结果。以上所得结果用于Python软件的实现，Python软件的设计优雅、明确、简单，同时语法清楚、易读、易维护便于我们使用。

4.总结与展望

过去对人脸研究主要集中于人脸识别。虽然表情识别与人脸识别密切相关(例如在人脸检测与定位、人脸跟踪这些环节上是一致的)但特征提取方法和研究的主要对象有很大区别:人脸识别提取的特征是不同人脸的个体差异(特性), 面部表情作为干扰信号存在;而表情识别是忽略个体差异, 提取人脸在不同表情模式下的差异特征, 人脸个体差异成为干扰信号。人脸表情识别是一个跨学科富挑战性的前沿课题, 但目前还只是研究课题尚没有进入实用化的领域。

人脸表情识别难度较大, 主要难在人脸都是塑性变形体,因此人脸表情不能用经典的几何模型来进行识别分类 , 更适合用弹性模型来描述。本文计算方法有优势也有劣势, 当前的发展来看采用三维动态和二维静态的混合法^[14]是进一步提高识别率的最有效的途径, 这也恰恰符合了人脸表情识别的神经学特性。在信息融合的的发展过程中，人脸表情识别会有很大优势与市场，对生理学和心理学结合^[15]对人脸表情的研究很有帮助。目前的计算机体系结构的特长是数值计算, 应该充分发挥它的计算能力。

5.参考文献

[1] 王志良,”人工心理学-关于更接近人脑工作模式的科学” ,《北京科技大学学报》 , 22(5)2000, pp.478～ 483.

[2] 黄双,邓焕明.PLC与工厂自动化技术的展望综述[J].可编程控制器与工厂自动化,2012(04):27-30.

[3] 魏海波,孙清,张君薇,林喆.基于PLC 和交流伺服系统控制的自动生产线输送系统[J].工业控制计算机机.2011(07):81-82.

[4] Ekman P (2007) Emotions revealed: recognizing faces and feelings to improve communication and emotional life, 2nd edn. Owl Books, New York

[5] Sim T,Baker S,Bsat M.The CMU Pose,Illumination,and Expression (PIE)database[C].In:Proceedings of Automatic Face and Gesture Recognition,ashington,DC,USA,2002:53~58

[6] Dana H Ballard,Christopher M Brown.Computer vision[M].Prentice Hall,Inc,1982

[7] Lucey P, Cohn J, Kanade T, Saragih J, Ambadar Z, Matthews I (2010) The extended Cohn-Kanade dataset (CK ): A complete dataset for action unit and emotion-speci#64257;ed expression. In: IEEE computer society conference on computer vision and pattern recognition workshops (CVPRW), pp 94#8211;101

[8] Wallhoff F (2006) Database with facial expressions and emotions from Technical University of Munich (FEEDTUM). http://www. mmk.ei.tum.de/~waf/fgnet/feedtum.html

[9] Zhao G, Huang X, Taini M, Li SZ, Pietikauml;inen M (2011) Facial expression recognition from near-infrared videos. Image Vis Com- put 29(9):607#8211;619.

[10] Wang Y, Guan L (2008) Recognizing human emotional state from audiovisual signals. IEEE Trans Multimed 10(4):659#8211;668

[11] 任成娟.基于改进的子模式局部保持映射人脸识别方法[J].电测与仪表2013(1):112-116.

[12] 闫奕名;张晔.基于多面化分解模型的目标信息获取优化技术[J].华南理工大学学报(自然科学版).2012.40(3):100-105.

[13] AlvarezM, LuengoD, LawrenceN(2013) Linear latent forcemod-els using Gaussian processes. IEEE Trans Pattern AnalMach Intell 35(11):2693#8211;2705. https://doi.org/10.1109/TPAMI.2013.86

[14] Rudovic O, Pantic M, Patras I (2013) Coupled Gaussian processes for pose-invariant facial expression recognition. IEEE Trans Pattern Anal Mach Intell 35(6):1357#8211;1369

[15] Zeng Z, Pantic M, Roisman G, Huang T (2009) A survey of affect recognition methods: audio, visual and spontaneous expressions. IEEE Trans Pattern Anal Mach Intell 31(1):39#8211;58

2. 研究的基本内容、问题解决措施及方案

毕业设计（论文）开题报告

２．本课题要研究或解决的问题和拟采用的研究手段（途径）：

l 要研究或解决的问题

在当今社会的发展过程中，人工智能的飞跃成长不得不得以信服。为了机器计算机与人类的交流更加便捷，引用心理理论对人的面部表情进行分析，得以了解人们的心理状态，以便于治疗抑郁症等等状况。在本实验中，目的是对采集所得到的表情进行图像分析和合成，从而对表情进行分类。实验流程具体如下：

1.摄像机的不同环境，不同地区人，不同光照等等情况下采集数据。

2.数据库的选取与建立（第一个数据库是Cohn-Kanade AU编码的人脸表情数据库，第二个数据库是来自慕尼黑技术大学的带有面部表情和情绪的FEED数据库，第三个数据库是OuluCASIA面部表情数据库，第四个数据库是RMLemotion数据库。

3.对实验人表情进行图像动态采集，投影与数据库中数据，根据SNR信噪比选取优先权，运用Python软件对数据进行计算处理，得以结果。

4.最终得以结论并加以总结。

l 采用的研究手段

(1)根据实验要求选取特定的数据库

(2)分配不同过程中所采用的方法（动态或静态，二维或三维，或动态三维与静态二维相结合），选取最优方法

(3)在其多种算法中选取最优且最便捷的方法（D-ABC算法、PSO算法、MR-ABC算法、Gabor算法等等）便于Python软件程序的编写。

(4)对数据处理结果运用验证

(5)得以结论

剩余内容已隐藏，您需要先支付 10元 才能查看该篇文章全部内容！立即支付

注册

找回密码