基于几何特征算法的人眼定位研究与实现毕业设计(编辑修改稿)内容摘要:

时,可以反应这两个变量有某种程度的重叠。 假设有 p个不相同的变量,然后有 q个不相关的新变量( q≤ p) ,这时这 q 个不相关的变量就可以表示 p,而且还会最大程度的不损失信息,这就是 PCA 特征提取,此方法获得了最大数据降维。 设有 N 个训练样本,每个样本根据其像素灰度组成一个向量 xi的维数的样本图像M=Width*Height(行像素数 *列像素 数 ),由向量构成的样本集为 [x1, x2,„, xN],这样本的平均向量为 x 1N∑ xiNi=1 (1) 平均向量又叫做平均脸,则每个训练样本与平均脸的偏差为 yi = xi − x (2) 则样本集的偏差矩阵为 D, D 的维数为 M*N。 D=[y0, y1, ……, yN−1] ( 3) 用式( 4)计算样本集的协方差矩阵 C, C的维数为 M*N。 C=DTD ( 4) 东华理工大学毕业设计(论文) 人眼检测定位的基本算法和理论 7 C=1N∑ yiyiTNi=1 ( 5) 求协方差矩阵 C 的特征向量 ei和对应的特征值 λi。 这些特征向量就是人脸空间的多组向量基,用这些向量基可以来表示任何获取到的人脸图像,且图像重要信息集中于特征值较大的特征向量 中,也就是说,即使有些表示特征向量小的数据丢失,也不会很大程度的影响图像的质量。 将特征值从大到小的排列 : λ1≥ λ2≥ „„ ≥ λm≥ „„≥ λM;对于某一 λm,若其过小,则可以忽略其影响,这样主成分构成的变换矩阵为 W=[e1, e2, …, em], mM (6) 也就是说任何的人脸图像都可以投影到上式上, W 的维数为 m*M,而这是一个基底,任何的人脸图像向其作投影时都会产生一组坐标系数,称之为 KL分解系数。 在现实的人脸的识别过程中,对于一个确定的样本人脸 x,该确定 的样本人脸图像与平均脸之间的偏差 y=x−x ,则 y在特征脸空间的投影,可以表示为系数向量 z,并用下面的公式表示: z=WTy (7) z 就是 KL 变换的展开系数向量,为 m*1 维。 所以这样的一个脸部图像就实现了可以用较低的系数向量来表示,从而实现了用低维向量表示原始的人脸部的特征。 下图表述了上述的过程。 独立分量分析( ICA) 独立分量分析是一种对多变 量 数据进行 非正交线性坐标变换的方法,坐标轴的方向由可观察到的混合数据的二阶和高阶统计信息确定,变换的目的是使变换后的变量间相互独立。 PCA 只考虑了模式的二阶统计量,他的特点就是变换后特征向量是相互无关的; ICA 不仅考虑了模式的二阶统计量,而且还分析了模式的高阶统计量, ICA的特点是变换后的独立独立量是独立非正交的 , ICA 可以更好的表示人脸视图的局部特征。 独立分量分析是于 1986 年提出的一种统计信号处理技术,它与 PCA 有一些相似之处,但也有不同之处。 ICA 的基本思想是用一组统计独立或者尽量独立的分量对随机变量进行表征。 简单的描述如下: 已知的观测数据为 X=( x1, x2, …, xm) , Si是未知分量,可以表示为S=( S1, S2, …, Sn) T,X和 S的关系为 X=AS 其中,分量 Si均值为零且相互间统计独立; A 是未知的特征矩阵。 S 的每一行 Si表示一个独立分量,矩阵 A 代表观测数据 X在各个独立分量特征轴上的幅值。 为了将ICA 应用到人脸识别的领域,可以使用矩阵 X=( X1, X2, …, Xt) T(t*m 维 )表示用于学习训练的人脸图像库,假设人脸的图像表示为 , Xi=(x1, x2, …, xm).首先可以东华理工大学毕业设计(论文) 人眼检测定位的基本算法和理论 8 应用不动点算法求解恢复矩阵 W( m*n 维),使得 XW=ASE=U。 这样得到的输出矩阵 U=XW就是虽未知的统计独立分量 S的估计,然后我们得到 U以后,用他的航向量为特征向量构造特征空间,所以每一张人脸图像投影到该空间后,都会得到一组对应的人脸空间向量。 所以选择合适的特征向量,他不但可以减小计算量还能够增强对不同人脸图片的分类能力。 所以在衡量各个特征的分类能力的时,额可以采用类内分散度和类 间分散度的比值 γ j, j=1,2,3„ m。 定义如下: 类内分散度 CIj为 CIj= 1pq(q−1)∑ ∑ ∑ (a(i−1)q+u,j − a(i−1)q+v,j)2qv=1qu=1pi=1 (8) 类间分散度 Bj为 CBj= 1p(p−1)∑ ∑ ρ(au,j −av,j)qu=1pi=1 (9) 其中 ai,j = 1q ∑ a(i−1)q+u,jqu=1。 特征的类内分散度与类间分散度的比率 γ j为 γ j = CIjCBj ( 10) 将 γ 值由小到大的排列 γ 1′γ 2′„ γ m′ ,取与前 K个 γ i′对应的 Ui′用于人脸识别,达到降维目的。 图 22 ICA 抽取特征脸模型 上图 (图 22) 就是运用 ICA 方法抽取人脸特征的模型。 假设原始的样本数据 X由未知的相互间统计独立的基图像 S 和线性的混合矩阵 A组成。 然后通过 W 的转化得到近似于基图像 S的图像 U。 新的待识别的图像 F与 U进行下面所示( 11)的公式运算,就可以得到用于表征人脸的系数。 ( a1, a2, …, ak) =FT*( U+) (11) 其中,( U+)表示 U 矩阵的伪逆,( U+) =(UUT)−1。 基于几何特征的算法 几乎所有的人眼定位的研究员都知道基于几何特征算法的人眼定位的方法是最常用的方法,相关文献认为:人眼睛周围的颜色的灰度值的梯度值是相近的。 也就是说若可以找到图片中某点周围灰度值相近最多的像素点,那么该点就是眼睛所在的区域,然后用相应的算法把该点标注出来即可。 东华理工大学毕业设计(论文) 人眼检测定位的基本算法和理论 9 要用此方法定位人眼区域需要先将真彩图片转换成相应的灰度图像,在 matlab函数中可用 rgb2gray 实现,继而获取 相应 x、 y坐标各自灰度的梯度,算出整体梯度,可用 gradient 函数实现,然后用 imadjust 函数来调节灰度图像的亮度,使之更加适合检测定位,继而用 im2bw 函数来使用阈值变化法把灰度图像转换成二值图像 ,这样就完成了对图像的预处理。 然后 就是此种几何算法的核心部分,根据人的眼睛的为近似圆形的方法,且圆形的半径大小约为 9— 13 个像素点的规律,采用循环程序,以每个点为圆心,不同半径的圆扫描 ,在圆上最多的边缘点就是眼睛的中心位置,然后用 imshow 函数来用指定的灰度值显 示图像,并用 plot 函数标注出所定位的区域,继而实现了人眼的定位,流程图 (图 23) 如下: 真 彩 图 像 转 换成 灰 度 图求 取 每 个 像 素点 的 梯 度调 节 灰 度 图 像的 亮 度以 每 个 像 素 点 为 圆 心 , 不 同 半径 的 圆 扫 描 图 片 , 并 收 集 边 缘点 的 个 数每 个 像 素 偶 点是 否 都 扫 描N得 到 边 缘 点 个 数 最多 的 坐 标 ( i , j)Y描 绘 出 图 像 并 用 蓝 色星 型 图 标 标 注 出 来使 用 阈 值 变 换 法 把灰 度 图 像 二 值 化 图 23 此种几何特征算法的流程 东华理工大学毕业设计(论文) 人眼检测定位的基本算法和理论 10 下面为此种 几何方法的人眼定位的效果图 (图 24) : 原始图片 定位后 原始照片 处理后 图 24 几何特征算法处理前后的效果图 由上两次的试验可以发现, 该 算法实现的人眼定位 有 时候并不能定位人眼的准确位置 ,还需要进一步的修改。 几种算法 特点和 优缺点的比较 几种算法的特点 PCA 和 ICA 以及几何法来确定人面部的特征的方法都是很热门的方法,大致的特点如下: ( 1) PCA 方法只提取图像上像素间的二阶统计信息,而 ICA 提取了高阶的统计信息。 ( 2) PCA 方法抽取的特征之间统计不相关,而 ICA 方法抽取的特征之间是统计独立。 ( 3)几何法的抽取面部的特征还是要基于预处理之后,根据面部人眼的几何特征来定位人眼,此种方法多是基于人眼的某种结构来定位的 几种算法的优缺点 任何算法都有其优点和缺点,上面介绍的几种算法的优缺点如下: ( 1) PCA 方法对于最小化重构的错误来说是最理想的,但这些用于特征分类并不是很理想, ICA 分类方面就比较有效。 ( 2)对图片作归一化处理 后, PCA 的 识别 方法 性能较好,但是若由于遮挡等因素给东华理工大学毕业设计(论文) 人眼检测定位的基本算法和理论 11 图片带来的影响时,基于 ICA 的识别的方法性能会更好 ( 3) PCA 的识别速率相对于 ICA 的较快, ICA 运用了更多维数的处理方法,使得速度较低。 ( 4)几何法识别定位人眼 几乎很 少会受到光照强度的影响,计算简单,定位的准确度较高,能够很好的定位人眼区域。 图像的色彩空间 RGB 色彩空间 RGB(red,green,blue)颜色空间最常用的 色彩空间 如下图(图 25)所示, 在 RGB色彩空间中 ,每一个数字图像中的像素点的颜色都可以用 RGB 三维空间的一个坐标点来表示。 如果 RGB 的值全为最大,则显示为白色。 若全为最小则显示黑色,若相等则显示图片的灰度。 图 25 RGB 色彩空间 YCbCr 色彩空间 YCbCr 色彩空间是为了适应视频处理中数字化算法而诞生的色彩空间。 YCbCr 色彩空间从 YUY 色彩空间衍生而来,其中 Y是亮度信息, Cb表示蓝色成分的多少, Cr表示红色成分的多少, Cb 和 Cr一起用来表示图片信息的色度和饱和度。 研究表明,不同人面部的色度信息相近,只有亮度信息相差较大。 又因为人脸的色度只在一个较小的区域里面变化,所以就要选择一个能将颜色信息与亮度信息分开的色度空间来描述颜色,而 YCbCr 色度空间就满足这个要求。 YCbCr 的不同的分量 可以由 RGB 经过线性变换得到,对应关系如下: [YCbCr1] = [ 0− − 128 − − 1280 0 0 1]∗[RGB1] ( 14) RGB 也可以通过 YCbCr 来转换,转换公式如下: 东华理工大学毕业设计(论文) 人眼检测定位的基本算法和理论 12 {R = Y + (Cr− 128)G = Y −(Cr−128)− (Cb− 128)B = Y +(Cb− 128) (15) 所以与其他的色彩空间比起来, YCbCr 色彩空间有着与人类视觉感知过程相类似的原理。 肤色在 YCbCr 空间的聚类性较好,且空间坐标表示比起其他的颜色空间要简单很多,所以本文就主要使用 YCbCr 色 彩空间进行研究。 二值化 二值化是图像处理的基本 处理 方法 ,被采用到各种识别领域 ,根据阈值选取的不同,二值化的算法被分为固定阈值和自适应阈值,比较常用的二值化方法为:双峰法、P 参数法、迭代法等。 一幅图像包括目标物体、背景以及噪声,要想从多值的数字图像中直接提取目标物体,最常用的方法就是设定一个阈值 T,用 T 将图像的数据分成两部分;大于 T 的像素群和小于 T的像素群, 当像素值小于设定的阈值时,置黑色,即 0;当像素值大于设定的阈值时,置白色,即 1。 公式表达如下: f(x,y) = {0, f(x,y) T1, f(x,y)≥ T ( 16) T 表示的是阈值,不同的场合阈值的取值 不一样。 BMP 格式图片 本系统只能识别和处理 BMP 格式的图片, BMP 格式属于 DIB 的一种,经常应用于windows 操作系统。 BMP 是英文 Bitmap(位图)的简写,能够被多种 Windows 应用程序 所支持。 这种格式的特点是包含的 图像信。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。