基于pca的人脸识别研究毕业论文(编辑修改稿)内容摘要:

法及隐马尔可夫模型方法等等。 基于局部特征分析的方法识别结果取决于特征定位算法的准确性,而且要求图像的像素较高,因此要近距离拍摄图片。 基于整体的识别方法也各自有自己的缺陷,所以近年来的研究趋势是将人脸的局部特征分析和整体识别结合起来。 常用的人脸识别方法 对人脸识别方法的研究主要有两大方向:一是基于人脸图像局部特征的识别方法;二是基于人脸图像整体特征的识别方法。 基于人脸图 像局部特征的识别通常抽取人脸器官如眼睛、眉毛、鼻子和嘴等器官的位置,尺度以及彼此间的比率作为特征。 进一步地可以用几何形状拟合人脸器官,从而以几何参数作为描述人脸的特征。 由于此类方法通常要精 7 确地抽取出位置、尺度、比率或几何参数作为描述人脸的特征,因此对人脸图像的表情变化比较敏感。 同时,人脸器官分割的精确度也对人脸特征的提取有一定的影响。 另外,该类方法并没有充分利用到人脸图像本身具有的获度信息,该方向已经不是人脸识别技术发展的主流方向。 基于人脸图像整体特征的人脸识别方法由于不需要精确提取人脸图像中部件的具体信息 ,而且可以充分利用到人脸图像本身具有的灰度信息,因此可获得更好的识别性能。 目前,绝大部分关于人脸识别方法的文章都是基于人脸图像整体特征的,主要有特征脸法、最佳鉴别向量集法,贝叶斯法,基于傅立叶不变特征法,弹性图匹配法,其他相关方法有线性子空间法,可变形模型法和神经网络法。 这些方法中有的侧重于表述人脸图像的特征提取,如弹性图匹配法和傅立叶不变特征法;有的则侧重于分类,如最佳鉴别向量集法、贝叶斯法和神经网络法;而有的则侧重于人脸图像重构,如特征脸法和线性子空间法。 所有这些基于人脸图像整体特征的人脸识别方法均取得 了一定的识别性能。 基于几何特征的人脸识别方法 基于几何特征的人脸识别方法主要源于人脸识别的初期研究阶段。 这种方法是以人脸各个器官和几何关系为基础进行算法设计。 对于不同人来说,脸上的各个器官,如眼睛、鼻子、嘴巴以及整个脸部的轮廓具有不同的形状、大小、相对位置和分布情况。 在基于几何特征的人脸识别方法中,可以用一个矢量来表示提取出来的几何参数。 如果要获得一个准确、稳定和可靠的识别结果,就要求这些被选出的几何特征参数包含足够丰富的辨识人脸的信息,且能反映不同人脸之间的差别。 也就是说对这些矢量要求具有较 高的模式分类能力,同时还要有一定的稳健性,能够消除由于时间变迁、光照变化等其他干扰因素所带来的影响。 具体来说,这些几何参数一般包括人脸上两个指定特征点之间的欧式距离、边缘曲率、角度等等。 在 Brunelli 和 Poggio 的文献中给出了一组典型的人脸几何特征参 8 数: (1)眉毛的厚度 (2)眉毛与眼睛中心的垂直距离; (3)描述左眼眉毛弧度的 12 个数据; (4)鼻子的宽度; (5)鼻子在面部上的位置; (6)嘴巴的垂直位置、嘴巴的宽度和上下嘴唇的亮度; (7)描述下颚形状的 11个半径数据; (8)以鼻子位置为准 的脸部宽度; (9)颧骨宽度 (半脸宽 )。 当这些几何特征参数提取出来后,就可以采用最小距离 (欧式距离 )分类器,将待识别人脸特征向量与数据库中人脸特征矢量进行比较,取距离最近者作为识别结果。 在实际应用过程中,基于几何特征的人脸识别方法存在着两个方面的问题: (1)如何快速、准确地检测出人脸的重要标志点依然是一个没有很好解决的问题。 (2)脸部几何特征在人脸辨识中的有效性问题,即脸部几何特征能够提供多少可供识别的信息量。 虽然各人脸的器官在形状、大小及分布上各不相同,但是这种器官上的差异性更多是体现在某些细微 的感觉意义上。 例如眼睛显得比较小、鼻子显得比较宽,以及皮肤的纹理、颜色上的差异等等。 显然,这些特征中的一部分是难以精确测量出来或者是不能用几何参数准确描述的。 所以仅靠增加脸上几何参数的数目来提高人脸识别率是不太现实的。 由于进一步改善测量精度是十分困难的,因而通过增加脸部几何参数的数量来改善识别率结果,其影响是极小的。 因此,基于少量人脸几何特征进行大规模人脸辨识的可靠性是不容乐观的。 9 基于 KL变换的特征脸方法 基于特征脸的人脸识别方法的基础是 KL 变换。 KL变换是图像压缩中的一种最优 正交变换。 通过 KL 变换,可以把图像在高维空间表示转换到低维空间表示,而由低维空间恢复的图像和原图像具有最小的均方误差,从而可以以图像在低维空间的变换系数作为人脸图像的描述特征。 KL 变换用于人脸识别的前提是人脸图像处于低维空间,并且不同人脸是线性可分的。 通常情况下, KL 变换的变换矩阵由训练样本类间散布矩阵的特征矢量生成。 人脸图像在前面的特征矢量上的投影有较大的能量,称为主分量。 在后面的特征矢量上的投影具有较小的能量。 称为次分量。 当舍弃部分次分量时, KL 变换也称为主成分分析法 (PCA)。 由于人脸图像具有相似的形状和结构,人脸 图像在主分量上的投影过多地反映了光照变化,因此有人提出舍弃人脸图像在前 3 个特征矢量上的投影,而用人脸图像在其余特征矢量上的投影作为描述人脸图像的特征。 KL 变换是数字图像压缩领域里的一种最优变换,它使从低维空间恢复的人脸图像和原图像的均方误差最小。 但 KL 变换只是从压缩角度来看是最优的,从分类角度来看却不是最优的。 虽然它考虑了人脸图像的所有差异 (从压缩角度 ),但没有考虑这些差异是类内差异 (如光照变化,头饰变化或几何变化 )还是类间差异 (从分类角度 )。 KL 变换是图像压缩的一种最优正交变换,人们将它应用 于特征提取,形成了子空间法模式识别的基础。 将 KL 变换用于人脸识别,需要假设人脸处于低维的线性空间,不同人脸具有可分性。 高维的图像空间经过 KL 变换后得到一组新的正交基,保留其中重要的正交基从而形成了低维的人脸空间。 若将所有子空间的正交基排列成图像阵列,则正交基呈现人脸的形状,因此这些正交基也被称为特征脸。 选择那些正交基形成的子空间则有不同的考虑,与较大特征值对应的一些正交基 (也称主分量 )能够表达人脸的大体形状,而具体细节需要那些小特征值对应的特征向量 (也称次 10 分量 )来加以补充描述,因此低频成分用主分量表示 ,高频分量用次分量表示。 采用主分量作为新的正交空间的正交基的方法称为主分量_(Principal Component Analysis,简称 PCA)方法。 KL 变换在 90 年代初受到了很大的重视,实际用于人脸识别取得了很好的效果,一般库德大小为 100 幅左右,识别率在 70% 100%之间不等,这主要取决于人脸库图像的质量。 从压缩能量的角度来看, KL 变换是最优的,变换后的低维空间对于人脸有很好的表达能力,较好的判别能力。 选择训练样本的散布矩阵作为 KL 变换的生成矩阵,其最大特征向量反映了该样本集合的最大分布 的方向,但这是图像统计方法,而不是人脸统计方法。 它查找的是图像之间所有的差异,并根据这些差异来确定不同人脸间的距离,而不管这些差异是由于光线、发型或背景的改变引起的,还是属于人脸本身的内在差异,因此特征脸的方法用于人脸识别存在理论的缺陷。 研究表明,特征连的方法随着光线、角度以及人脸的尺寸的引入而识别率急剧下降。 主分量的方法使得变换后的表达能力最佳,次分量的方法考虑了高频的人脸区分能力,但是由于外在因素带来图像差异和人脸本身带来的差异对 KL变换而言是不加任何区分的,因此,如何选择正交基并不根本解决问题。 改进 的一个思路是针对干扰所在,对输入图像作规范化处理,包括输入图像的均值方差归一化,人脸尺寸归一化。 另一种改进是考虑到局部人脸图像受到外在干扰相对较小的情况,除了计算特征脸之外,还利用 KL 变换计算出特征眼、特征嘴等。 将局部特征向量加权进行匹配得到一些好的效果。 总之,特征脸方法是一种简单、快速、使用的基于变换系数的算法,但由于它在本质上依赖于训练集合测试集图像的灰度相关性,而且要求测试图像与训练集比较接近,所以存在着很大局限。 神经网络方法 人工神经网络是一种以大量的处理单元 (神经元 )为节点,处理单 元之间实现加权值互连的拓扑结构。 人工神经网络中的处理单元是人类大 11 脑神经单元的简化。 处理单元之间的互连则是轴突、树突这些信息传递路径的简化。 根据不同的应用场合,现已研究出较多的神经元网络模型及其动态过程的算法。 人工神经元通常采用非线性的作用函数,当大量神经元连接成一个网络并动态运行时,则构成了一个非线性动力学系统。 人工神经网络具有自组织性、高维性、模糊性、分布性和冗余性等等特点,较冯 诺依曼体系的计算机更适合模拟人类大脑的思维机理。 但总的来说,由于人类对自身思维机理认识的不足,所以对人工神经元作了极度的简化 ,这种模拟表现为极其肤浅和简单。 很多脸部识别系统都采用了多层感知机 (Multi. Layer Perceptor)作为人工神经网络的基本结构。 多层感知机由几层全互连的非线性神经组成。 神经元之间有权值连接,权值包含了训练模式空间的特征。 训练过程就是调整权值的过程,最常用的算法就是 BP法则。 采用多层感知机进行面部识别的目的就是建立一个关于脸部的紧凑表示,这相当于面部特征的抽取。 因为隐层节点的数目 L 通常要远远小于输入层和输出层的节点数目,从而多层感知机将高维德输入数据变换到一个低维子空间中,同时保留了原始数据中 最重要的信息。 如果隐层神经元采用线性作用函数,则多层感知机张成的降维子空间将与主元分析法张成的子空间一样。 主元分析法的方差是由大到小排列的,而多层感知机的方差是均匀分布到每个隐层神经元上。 多层感知机的输入形式有很多种,最简单的就是将整个人脸图像作为输入层,也可以对人脸图像进行采样,然后用低分辨率图像作为输入层。 还有的文献采用了二进制图像的等密度区域或多个局部面部特征作为不同多层感知机的输入层。 直接使用 BP 神经网络进行人脸识别的问题在于网络过于庞大和复杂,例如对于一幅 128 128 的人脸图像,输入层和输出 层的节点数目将达 16438。 显然,训练这样大的一个网络将花费很长时间,需要的存储量 12 也会很高。 由此可以看出,人工神经网络有着与 Eigenface 方法非常相似的表达方法。 一般来说, BP 算法的收敛速度非常缓慢,学习过程可能需要对整个训练集进行上千次反复迭代运算,这是神经网络实际应用的一个问题。 此外, BP 算法以误差梯度下降的方式达到极小值,但在实际应用中,容易陷入到局部极小中,无法得到全局最优解,这也是有待解决的一个问题。 弹性匹配图脸部识别方法 在利用图匹配进行识别的方法中,一个目标 (如一个人脸图像 )可 以采用一张图 (Graph)来表示。 根据局部化空间频率得到的一系列多分辨率秒数值可以用来表示图中的节点数值。 物体内部的空间关系则可以用节点之间的几何距离表示。 Gabor变换是进行时频分析的有效工具,该函数在时间域和频率域上都是局部化的,通常将 Gabor 特征用到针对脸部识别的弹性图匹配中。 Gabor特征在网格节点上提供了一个多尺度边缘强度。 一般来说,图像中的关键部位会有较大的 Gabor 系数。 同样的,对于一个待识别的人脸图像也可以定义一个网格 G 及网格上的特征矢量。 在弹性图匹配 (Elastic Graph Matching)方法中,两幅图的距离是通过寻找 G 与 M之间的最优匹配来得到。 在弹性图匹配方法中,将人脸图像库中的图像和待识别图像都用特征矢量图表示。 通过对突遇图之间的拓扑结构的匹配以及节点与节点之间的特征矢量值的比较,可以进行人脸识别,这就将模板的图像匹配转化成了模板的图匹配。 在寻找最佳匹配方法时,希望能够同时维持特征数值接近和局部几何关系。 弹性图匹配方法的最大优点在于对光和表情变化的相对不敏感性。 这主要归功于两个原因: (1)用 Gabor变换可提取图像的局部多分辨率特征; (2)在计算距离或者能量函数时,使用 了变形匹配方法。 弹性匹配图方法的主要缺点在于计算量大。 13 隐马尔可夫模型的识别方法 隐马尔可夫模型 (Hidden Markov Model)一般应用于非平稳时间序列矢量的统计建模,在语音处理,特别是语音识别中得到广泛的应用。 隐马尔可夫模型为一个观测序列提供了一个统计模型 n 引,该模型由两个互相关联的过程组成: (1)一个是底层不可观测的马尔可夫链,它由有限个状态、一个概率转移矩阵和一个初始状态概率分布函数组成。 (2)另外是一组联系每一个状态的概率密度函数。 在使用隐马尔可夫模型的面部识别方法中,首 先将一个人脸图像采集成一系列的条状图,将一幅二维图像变成一个一维矢量序列,这个序列构成了隐马尔可夫模型的观测矢量。 由于人脸的特定构造,在这种抽样方式下,脸部特征带的出现将服从于一定的顺序,所以该模型可以用一个从左到右的隐马尔可夫模型表示,其中状态的转移只能按照从左到右的方式进行。 接着是训练该隐马尔夫模型,由以下几个步骤组成: (1)建立一个隐马尔可夫模型; (2)用训练数据迭代计算初始参数值; (3)用 Baum— Welch方法重新估计参数值。 识别通过一个 Viterbi 识别器完成,用代表不同人的隐马尔可夫模型与待识别图像匹配,最高匹配者被选出来。 基于 FISHER 线性判别式的方法 提出了一种基于 Fisher 线性判别式的人脸识别方法,与 Eigenface。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。