基于android的视觉手势识别毕业论文(编辑修改稿)内容摘要:

网络模型,输入层、中间隐含层和输出层的神经元个数分别为 50 和 9。 图 22 三层前馈神经网络模型 BP 网络学习是典型的有导师学习。 训练集包含 M 个样本,对第 P 个训练样本(P=1,2,„, M),单元/的实际输出为郇.,它的第 i 个输入 (也即第 i 个神经元的输入 )为 piO ,则: Ni pijipi OWu 0 (21) BP算法中大多选用 S型函数作为输出函数,即: 9 )e x p (1 1)( pjpjpi uufO  (22) 2. 3. 2 基于模板匹配的算法 模板匹配算法就是将输入的原始数据与预先存储的模板进行匹配,通过测量两个模板之间的相似度进行识别。 模板匹配的方法多用于静态手势识别中,如Cui Yuntao 通过计算模板的相关系数来进行预测匹配。 文献 f181 中张良国、吴江琴、高文等人首先改进了 Hausdorff 距离,接下来通过比较预处理后的输入图像的 Hausdorff 距离和标准模板库中各种图像的 Hausdorff 距离进行判断。 Hausdorff 距离是描述两组点集之间相似程度的一种量度,它是两个点集之间距离的一种定义形式【 191:假设有两组集合 A={ paaa ..., 21 }, B={ qbbb ..., 21 },则这两个点集之上的 Hausdorff 距离定义为: )),(),(m a x(),( ABhBAhBAH  (23) baBAh BbAa   m inm a x),( (24) abABh AaBb   m inm a x),( (25)  是点集 A和点集 B间的距离范式 这里,式 (23)称为双向 Hausdorff 距离,是 Hausdorff 距离的最基本形式;式 (24)(25)中的 h(A, B)和 h(B, A)分别称为从 A集合到 B集合和从 B 集合到A集合的单向 Hausdorff 距离。 即 h(A, B)实际上首先对点集 A 中的每个点 ia 到距离此点最近的 B集中点 b,之间的距离 ji ba 进行排序,然后取该距离中的最大值作为 h(A, B)的值, h(B, A)同理可得。 由式 (23)知,双向 Hausdorff 距离 H(A, B)是单向距离 h(A, B)和 h(B, A)两者中的较大者,它度量了两个点集之间的最大不匹配程度。 2. 3. 3 统计分析算法 统计分类算法是在模式识别发展的过程中建立的经典方法,它用概率统计模型得到各类别的特征向量分布,以达到分类的目的。 统计分类算法是一种监督学习的模式识别方法。 如何将分类器设计得更有效,识别率更高,是需要重点解决的问题。 当几个类别的样本在特征空间的分布符合一定的拓扑结构,并且我们知道各个类别的概率分布函数时,我们就可以利用统计分类方法进行模式识别。 常用的统计分类方法有很多,例如‘ 39。 by. product”方法、决策树和决策表方法等。 10 模式的统计分类方法,又称为决策理论识别方法,它是将各模 式类别看成是用某个随机向量实现的集合。 属于同一类别的各个模式之间的差异,有些是由环境噪声和传感器的因素引起的,有些是模式本身所具有的随机性质引起的。 在通常情况下,不同类别的两个模式之间的距离要大于同一类别的两个模式之间的距离,这样就可以将特征空间准确的划分为几个区域,其中各个区域同各个类别是一一对应的。 若不满足上述条件,则对每个特征向量估计其属于某一类的概率,概率值最大的类就是该点所属的类别。 统计分类方法常用的分类器主要有贝叶斯分类器、线性判别函数、树分类器、最小距离分类、近邻法分类、聚类分析等。 2. 3. 4 隐马尔可夫模型 (HMM) 在给定前一个状态的情况下,随机变量序列的下一个状态的出现是条件独立的。 每一个时刻的随机变量有一个度量值,这个度量值的分布与该时刻的状态有关。 这样的模型称为隐马尔可夫模型 (HMM)。 隐马尔可夫模型是在 Markov 链的基础之上发展起来的。 实际问题比马尔可夫链所描述的更为复杂,观察到的事件并不是与状态一一对应的,而是通过一组概率分布相联系的。 它是一个双重随机过程:一是描述状态转移的马尔可夫链是基本随机过程;另一个是描述状态和观察值之间的统计对应关系是随机过程。 基于以上原因观察者只能看到 观察值不能直接看到状态,即让观察者通过一个随机过程去感知状态的情况,所以称之为“隐”Markov 模型。 如图 23为隐马尔可夫模型组成的示意图。 HMM 作为信号的一种统计模型,已经在语音信号处理领域得到了广泛应用,近年来很多研究者也将 HMM用于手语识别领域。 但是应用于手势识别时有很多约束。 首先,动态手势信号不满足马尔可夫性质,也就是说随机向量当前的状态只与 前 一状态有关;其次,仅用隐马尔可夫模型对手势建模远远不够,会导致隐马尔可夫模型将许多信号作为噪声处理。 图 23: 隐马尔可夫模型组成 11 2. 4 基于计算机视觉 的手势跟踪与识别系统 计算机视觉研究就是计算机通过对一幅或多幅图像进行分析,从中获取三维世界的运动信息或者集合特征,例如物体的位置、形状、姿态运动等信息,接下来对这些信息进行分析、处理,以达到认识三维世界的目的。 计算机视觉作为一门新兴的学科,正在受到越来越多的关注。 视觉运动分析方法因具有适用范围广、抗电子干扰能力强、测量精度高和保密性好等优点,在军事、导航、机器人技术、气象分析、医疗诊断、交通管制、安全防范等领域得到了广泛的应用。 手势作为人类最自然的表达方式之一,在日常生活中得到了广泛的应用。 同时,手势具 有适应性强、形象生动及简便易行等特点,比较适合在非特定环境下对机器人的控制。 通常一个完整的手势跟踪与识别系统,分为以下几个部分: (1)手势的检测与跟踪:手势的检测与跟踪是手势识别的基础,其好坏将影响识别率的大小。 手势分割的方法大体分为三种:基于运动信息的、基于运动模板的和基于颜色信息的。 国内外对手势跟踪也做了大量研究,常用的有卡尔曼滤波 (Kalmall Filter)、粒子滤波 (Particle Filter)等跟踪方法。 (2)静态手势识别:静态手势识别是指对于静态图片中手的形状和手的姿势进行识别。 国内 外对静态手势识别做了大量研究。 例如文献 f81 中提出了一种使用神经网络方法和 Hough 变换对中国手语中的 20 种手势进行识别。 在文献『 91中采用基于表观的手势模型,提取八个手势特征组成特征向量,采用二次分类 (粗分类和细分类 )的方法对 10 个常用的静态手势进行识别。 (3)动态手势识别:动态手势识别是对连续的手势序列进行实时的跟踪,通过对跟踪到的手势运动的时空轨迹 (spatial. temporal trajectory)或手势状态轨迹 (state trajectory)进行处理,以识别摆手等动态手势。 3 手势图像预处理及特征提取 手势图像的预处理和特征提取是下一步要进行的手势跟踪与识别的前提,其质量的好坏既关系到手势的识别率,又关系到所建立的人机交互系统的整体性能。 本章针对图像采集时所遇到的光照变化、旋转、平移等不确定因素,对手势图像的预处理和特征提取进行了分析。 12 3. 1 手势图像预处理 在手势图像的预处理阶段,为了得到理想的分割效果,本文对采集到的手势图像采用了图像平滑、色彩空间转换、图像二值化以及形态学处理等算法以得到准确的手势二值化图像。 3. 1. 1 图像平滑 图像平滑的目的是为了消除噪声。 图像噪声的 来源有三种:一是在光电、电磁转换过程中引入的人为噪声;二是大气层电 (磁 )暴、闪电、电压、浪涌等引起的强脉冲性冲激噪声;三是自然起伏性噪声,由物理量的不连续性或粒子性引起,这类噪声又可分为热噪声、散粒噪声等。 消除噪声的方法又可以分为空间域方法或频率域方法,亦可以分为全局处理方法或局部处理方法等。 1.邻域平均法 邻域平均法 I刎是简单的空域处理方法。 这种方法的基本思想是用几个像素灰度的平均值来代替每个像素的灰度。 假定有一幅 NXN 个像素的图像 ),( yxf ,平滑处理后得到一幅图像 ),( yxg。 ),( yxg 由下式决定:  Snm nmfMyxg ),( ),(1),( ( 31) 式中, 1,...,1,0,  Nyx S是点伍纠所在领域的中点的坐标集合,但不包括 ),( yx点; M是集合内坐标点的总数。 式 (3. 1)说明,平滑后的图像中 ),( yxg 每 个像素的灰度值,均由似一邻域中包含的像素灰度值的平均值来决定。 2.中值滤波法 中值滤波【 211 是一种非线性滤波,由于它在实际运算过程中并不需要图像的统计特性,所以比较方便。 中值滤波首先是被应用到一维信号处理技术中,后来被二维图像信号处理技术所引用。 在一定的条件下,它可以克服线性滤波器所带来的图像细节模糊,而且对滤除脉冲干扰及图像扫描噪声最为有效。 但是对一些细节,特别是点、线、尖顶细节多的图像不宜采用中值滤波的方法。 3.频域平滑技术 13 图像的平滑既能够在空域中进行,又能够在频域中进行。 频域平滑技术是一维信号 低通滤波器在二维图像中的推广。 对于一幅图像,它的边缘、跳跃部分以及噪声都代表图像的高频分量,而大面积的背景区和变化缓慢的部分则代表图像的低频分量,用频域低通滤波器除去其高频分量就能去掉噪声,从而使图像得到平滑。 滤波器的数学表达式为: ),(),(),( vuFvuHvuG  ( 32) 其中 F(u, D为原图像的傅立叶变换, ),( vuG 为平滑后图像的傅立叶变换,),( vuH 是滤波器的转移函数。 常用的低通滤波器有: (1)理想低通滤波器 一个理想低通滤波器的传递函数为:  Dv)D ( u , 1 Dv)D ( u , 0 00),( vuH ( 33) 其中 D。 为截止频率,   2122),( vuvuD  是点( u, v)到频率平面原点的距离。 理想低通滤波器在处理过程中会产生比较严重的模糊和“振铃”现象,这是由于 H(u, v)在 D。 处由 1 突变到 0,这种理想的 H(u, v ), D 对 应的冲激响应 h(u, v)在空域中表现为同心环的形式,并且此同心环数与 D。 成反比, D。 小,同心环数越多,模糊程度越厉害。 正是由于理想低通滤波存在“振铃 现象,其平滑效果才下降。 (2)巴特沃斯滤波器 一个巴特沃斯滤波器的传递函数为: nDvuDvuH 20),(11),(。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。