特征脸识别外文翻译资料

2022-07-30 16:35:33

英语原文共 17 页，剩余内容已隐藏，支付完成后下载完整资料

引用文献：

[1]Matthew Turk and Alex Pentland,Eigenfaces for Recognition, Journal of Cognitive Neuroscience, 1991, Volume 3, Number 1:page 71-76

特征脸识别

马修·土耳其和亚历山大·奔德兰

视觉和建模组

媒体实验室

麻省理工学院

摘要

我们已经搭建了一个能够找到并跟踪受试者的头部的近实时计算机系统，并且从这些识别到的个体中通过比较脸部特征辨别出单独的人。在这个系统中采用的计算方法是由生理学和信息理论所激发的，并且满足近实时性能和准确性的实际要求。我们的方法将面部识别问题视为本质上二维(2-D)识别问题，而不是三维几何的复原问题。利用面部通常是直立的这一事实，我们可以通过一小组2-D特征图来描述脸部特征。

本系统的功能是将人脸图像的重要特征投影到特征空间,跨越人脸图像本身之间的显著差异,因为这些重要的特征是一组人脸的一些特征向量（主成分）,我们把这些特征称为“特征脸”。它们不一定对应于有诸如眼睛，耳朵和鼻子的特征，我们通过得到人脸各个对应特征在特征脸中对应的权值总和判断人脸特点，因此为了识别特定的面部，仅将这些权重与已知个体的权重进行比较。我们的方法的一些特别的优点是它提供了以无监督的方式学习和后来识别新面孔的能力，并且使用神经网络架构较容易实现。

说明

人脸作为我们社会交际关注的基本焦点，在传达身份和情感方面发挥重要作用。虽然从面部外观推断出智力或性格的能力是可疑的，但是人的识别能力是显著的。在我们一生中会看到成千上万的面孔，即使经过多年的分离,我们也能一目了然地识别熟悉的面孔。这个技能很强大，尽管由于观看条件，表情，老化以及诸如眼镜或发型或面部毛发变化引起的干扰，视觉刺激有很大的变化。因此，人类面孔的视觉处理已经使哲学家和科学家们深深地迷住了几个世纪，包括亚里士多德和达尔文等人物。特别是面部识别的计算模型是很有趣的，因为它们不仅可以有助于理论观点，而且可以有助于实际应用。

识别面孔的电脑可以应用于各种各样的问题，包括犯罪识别，安全系统，图像和电影处理以及人机交互。例如，将特定面部建模并将其与大量存储的面部模型区分开的能力将有可能大大改善犯罪识别。即使只是检测面孔的能力，而不是辨认它们，这一点很重要。例如，照片中的检测面是自动化彩色胶片显影中的一个重要问题，因为许多增强和降噪技术的效果取决于图像内容（例如，脸部不应该着色为绿色，也可能是草）。

不幸的是，开发面部识别的计算模型是相当困难的，因为面部是复杂的，多尺寸的和有意义的视觉刺激。它们是一种自然的物体，与正弦波光栅，“块世界”和人类和计算机视觉研究中使用的其他人造刺激形成鲜明对比（Devies，Ellis，amp;Shepherd，1981）。因此，与大多数早期视觉功能不同，我们可以构建视网膜或条纹活动的详细模型，面部识别是相当神经活动的计算方法的非常高级别的任务。

因此，我们将研究重点放在开发一种不依赖于三维信息或详细几何的早期预注意模式识别能力。我们相信我们已经达到的目标是开发面部识别的计算模型，在诸如办公室或家庭的受限环境中快速，共鸣简单，准确。此外，该方法具有生物可实现性，并且与面部识别生理学中的初步发现相一致。

该方案基于将面部图像分解为称为“特征脸”的一小组特征特征图像的信息理论方法，其可以被认为是面部图像的初始训练集的主要部分。通过将新图像投影到由特征面（“面部空间”）跨越的子空间中，然后通过将其在面部空间中的位置与已知个体的位置进行比较来对面部进行分类来执行识别。

在这个框架内，自动学习和认识新面孔是实用的。通过对有限数量的特征视图进行训练（例如，直视图，45角度视图和轮廓视图）来实现在广泛变化条件下的识别。该方法在其速度和简单性，学习能力以及对面部图像的小的或逐渐变化的敏感度方面优于其他面部识别方案。

背景和相关进展

计算机识别脸部的大部分工作重点是检测眼睛，鼻子，嘴巴和头部轮廓等个体特征，并通过这些特征之间的位置，大小和关系来定义面部模型。这些方法被证明难以扩展到多种观点，并且往往是相当脆弱的，需要一个很好的初步猜测来指导它们。此外，人类面部认知的人类策略研究表明，个人特征及其直接关系包括不足以代表成人人脸识别的表现（Careyamp;Diamond，1977）。尽管如此，这种面部识别方法仍然是计算机视觉文献中最受欢迎的方法。

Bledsoe（1966a，b）是第一个使用混合人机系统尝试半自动人脸识别的方法，该系统根据手工拍摄的基准标记对脸部进行分类。分类参数是标准化距离和点之间的比例，如眼角，嘴角，鼻尖和下巴点。后来贝尔实验室的工作（Goldstein，Harmon，amp;Lesk，1971; Harmaon，1971）开发了多达21个特征的向量，并使用标准模式分类技术来识别人脸。所选择的特征主要是由人类受试者进行的主观评估（即，头发的阴影，耳朵的长度，唇部厚度），其中每个都将非常难以自动化。

Fischler和Elschager（1973）的一篇早期论文试图自动测量相似的特征。他们描述了一种线性嵌入算法，其使用绘图特征模板匹配和全局测度来找到并测量面部特征。Yuille，Cohen和Hallinan（1989）最近的工作，这种模板匹配方法得到了持续和改进（参见Yuille，本卷）。他们的策略是基于“可变形模板”，它们是面部的参数化模型及其特征，其中通过与图像的交互来确定参数值。

人脸身份识别的连接方法是寻求捕捉外形或类似特征。Kohonen（1989）和Kohonen和Lahtio（1981）描述了一种具有简单学习算法的联想网络，可以识别（分类）面部图像，并从不完整或嘈杂的版本输入到网络调用面部图像。Fleming和Cottrell（1990）使用非线性单位来扩展这些想法，通过反向传播来训练系统。Stonham的WIZARD系统（1986）是基于自然网络原理的通用模式识别设备。二进制面部图像已被应用于二进制脸部图像，同时识别身份和表情（参见1 9 8 8年，Midorikawa，O#39;Toole，Millward，Anderson，1988）。处理面部的大多数连接体系统将输入图像视为一般二维图案，不能明确地使用脸部的配置特征。此外，这些系统中的一些需要过多的培训示例才能得到合理的评估标准。迄今为止已经探索到非常简单的系统，并且不清楚它们如何扩展到更大的问题。

其他人已经通过一组几何参数表征脸部并通过参数进行模式识别（例如，Kaya amp; Kobayashi，1972; Cannon，Jones，Campbell，amp;Morgan，1986; Craw，Eills，amp; Lishman，1987年，Wong，Law amp; Tsaug，1989）。Kanade（1973）的面部识别系统是使用由预期特征特征的通用模型指导的自顶向下控制策略的第一个（也是少数几个）系统中的识别过程的所有步骤都是自动化的系统。他的系统从单个面部图像计算了一组面部参数，并使用模式分类技术来匹配来自已知组合的面部，纯统计方法主要取决于局部直方图分析和绝对灰度值。

最近进展中Burt（1988a，b）使用了基于多分辨率模板匹配的“智能感知”方法。这种粗略到精细的策略使用专门用于计算多分辨率金字塔图像的专用计算机，并且已经被证明可以实时识别人们。该系统在有限的情况下工作良好，但会受到基于相关性匹配的典型问题的困扰，包括对图像尺寸和噪声的敏感度。此方法脸部模型是由脸部图像手工构建的。

特征脸法

以前在自动化脸部识别方面的许多工作忽视了面部刺激的哪些方面对识别很重要的问题。这意味着，面对图像编码和解码的信息理论方法我们可以洞察人脸图像信息内容，强调重要的本地和全局“特征”。这样的特征可以或可以不直接关系到我们直观的眼睛，鼻子，嘴唇和头发等特征的概念。这可能对识别工具（如Identikit和PhotoFit）的使用有重要的影响（Bruce，1988）。

在信息理论的语言中，我们要提取面部图像中的相关信息，尽可能高效地进行编码，并将一个人脸编码与类似编码的模型的数据库进行比较。提取面部图像中包含的信息的简单方法是以某种方式捕获面部图像集合中的变化，独立于特征的任何判断，并且使用该信息来编码和比较各个面部图像。

从数学角度分析，我们希望找到面部分布的主要组成部分，或面部图像集合的协方差矩阵的特征向量，将图像作为点（或向量）处理在非常高的维度空间中。特征向量被排序，每个特征向量在面部图像之间的变化量很大。

这些特征向量可以被认为是一组特征，它们一起表征面部图像之间的变化。每个图像位置或多或少地对每个特征向量贡献，使得我们可以将特征向量显示为一种影子脸，我们称之为特征向量。我们研究的一些面孔如图1所示，相应的特征图如图2所示。每个特征面偏离均匀灰色，其中一些面部特征在训练面部组之间不同; 它们是面部之间变化的一种映射。

每个单独的脸可以根据特征脸的线性组合来精确地表示。每张脸也可以仅使用具有最大特征值的那些“最佳”特征脸近似，并且因此在脸部图像集合中占最大差异。最好的M张特征脸覆盖所有可能图像的M维子空间“脸空间”。

使用特征脸的想法是由Sirovich和Kirby（1987）和Kirby和Sirovich（1990）开发的一种用于使用主成分分析有效地表示面部图像的技术。从原始脸部图像的集合开始，他们计算出一个最佳的图像压缩坐标系，其中每个坐标实际上是一个他们称为特征图像集合的图像。他们认为，最终原则上，通过存储每个面部的一小部分权重和一小组标准图片（特征图）可以近似地重建任何面部图像的集合。通过将脸部图像投影到特征图上，可以发现描述每个脸部的权重。

我们认为，如果可以通过特征特征或特征图的小集合的加权和来重构多个面部图像，则可能通过比较需要的特征权重来建立特征特征来学习和识别面部的有效方式（大约）用与已知个体相关联的权重重建它们。因此，每个个体的特征在于，与图像本身相比，描述和重建它们时所需要的特征或特征图像权重很小。

这种面部识别方法涉及以下初始化操作：

获取一组初始脸部图像（训练集）。
从训练集中计算特征脸，只保留对应于最高特征值的M个图像。这些M个图像定义了面部空间。随着新脸被训练，特征面可以被更新或重新计算。
通过将他们的脸部图像投影到“面部空间”上，计算每个已知个体的M维重量空间中的相应分布。

这些操作也可以每当有额外的计算能力时不时地执行。

初始化系统后，以下步骤用于识别新的脸部图像：

通过将输入图像投影到每个特征面中，基于输入图像和M本征面来计算一组权重。
通过检查图像是否足够靠近“脸部空间”，确定图像是否完全是脸部（无论是已知的还是未知的）。
如果它是一张脸，将重量模式分类为已知的人或未知的。
（可选）更新特征面和/或重量图案
（可选）如果几次看到相同的未知面孔，请计算其特征重量图案并将其并入已知面。

计算特征脸

令面部图像为8字节的二维N乘以N的矩阵。图像也可以被认为是尺寸的向量，因此，尺寸256times;256的典型图像变为维度65536的矢量，或者等价于65536维空间中的点。然后，一个图像集合映射到这个巨大空间中的一个点集合。

在整体配置上相似的脸的图像将不会随机地分布在这个巨大的图像空间中，因此可以通过相对低维的子空间来描述。主成分分析（或Kahumen-Loeve扩展）的主要思想是找到最能说明整个图像空间内面部图像分布的向量。这些向量定义了面部图像的子空间，我们称之为“脸部空间”。每个向量是长度，描述N乘N图像，并且是原始面部图像的线性组合。因为这些矢量在外观上是面对面的，所以将它们称为“特征脸”。特征脸的一些例子如图2所示。

定义训练集中的这些人脸图像为训练集的平均脸定义为每张脸和平均脸的差别表示为图1a展示了一个样本训练集，图1b是其对应的平均脸然后对该组非常大的向量进行主成分分析，其主要寻找一组最正确的描述数据分布的正交向量的向量。第k个向量这样选择：

其最大值受限于

向量和标量对应特征向量和特征值，相应的，其协方差矩阵为

此处矩阵矩阵是乘维的，确定这个特征向量和特征值是很棘手的事。我们需要一种可行的计算方法来找到这些特征向量。

如果图像空间中的数据点数小于空格的维数(),那么将只有M-1维，而不是维有意义的特征向量（剩余的特征向量对应特征值为0）。

全文共6581字，剩余内容已隐藏，支付完成后下载完整资料

资料编号：[143193]，资料为PDF文档或Word文档，PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容！立即支付

注册

找回密码