基于神经网络的手写数字识别系统的设计与实现毕业论文(编辑修改稿)内容摘要:

B 运行结果如图。 图 归一化处理 细化 许多字符识别方法在预处理中都很重视对二值化字符的细化处理。 直观来说,细化就是将二值化字符点阵逐层剥去轮廓上的点,变成笔画宽度只有一个像素宽度的字符骨架图形。 之所以需要细化处理,是因为二值化点阵图形中,对识别有价值基于 神经网络的手写数字系统的设计与实现 第二章 手写数字识别 9 的文字特征信息主要集中在字符骨架上,细化后的字符骨架既保留了原字符的绝大部分的特征,又利于特征提取。 细化后骨架的存储量比原来的二值化字符点阵要少得多,降低了处理工作量。 手写体数 字细化的 基本要求如下: 第一、保持原有字符笔画的连续性,不能由于细化造成笔画断裂。 第二、要细化为单线,即笔画宽度为一个像素。 第三、细化后的骨架应尽量是原来笔画的中心线。 小结 预处理是手写数 字识别中不可缺少的组成部分 ,对图像预处理的好坏直接影响到识别的结果 , 关系到识别算法的好坏。 文中首先对待识别数字的预处理进行了介绍,包括平滑去噪、二值化、归一化、细化等图像处理方法,经过这些预处理步骤 , 对图像中部分变形信息进行了修正 , 消除图像中与识别无关的因素 , 而且尽量保持原图像的字符特征 , 在实验中提高了数 字识别网络的性能。 基于 神经网络的手写数字系统的设计与实现 第三章 特征提取 10 第三章 特征提取 特征提取的概述 模式识别使用特征来区分不同的种类。 因此,特征提取是模式识别系统的关键部分。 特征提取的目标是找到某种变换,将 N 维或 N*N 维的模式类别空间转换到维数小得多的 M 维特征空间,并同时保留模式识别所需要的大部分信息。 通过特征提取,模式分类可以在维数低得多的空间上进行,从而降低了计算的复杂度。 而且,对给定的训练样本进行特征提取可以获得更精确的分类函数的描述,以构造更可靠的分类规则。 同样对于手写 体数 字的识别,特征提取可以降低字符信息 量、去除无用的冗余信息, 提高识别系统效率,一直是字符识别领域 中的关键点。 特征提取的目的是从原始数据中抽取出用于区分不同类型的本质特征。 无论是识别过程还是学习过程,都要对研究对象固有的、本质的重要特征或属性进行量测并将结果数值化,形成特征矢量。 手写体 数 字的识别中,常用的特征有结构特征和统计特征。 结构特征和统计特征各有其优点:结构特征能描述字符的结构,对于不同人书写的字符,形体不同,但结构都是一致的,所以结构特征能克服手写字体因人而引起的畸变;统计特征最大的优点是对环境噪音不敏感,如若字符的背景噪音通常都是呈高斯分布,用统计特征进 行识别可对此影响忽略不计。 本章将用两小节分别对结构特征和统计特征进行论述。 统计特征 对复杂图像信号作小波变换 [11],进行多分辨率分析,已经成为图像信号分析和处理的常用方法。 由于小波变换的结果体现为大量的小波分解系数,这些系数包含了系统或信号本身大量和多样的特征信息。 如果图像信号的主要信息能以一个或一组特征量来表征,我们就可以更加直观、有效和方便地对各种随机信号进行信息提取、信号检测、特征识别。 统计特征分为宏观特征信息和局部特征信息。 宏观特征信息是需要在整幅图像上获取的特征信息。 传统的全局特征 主要包括:全局变换特征(对字符图像进行各种变换,利用变换系数作为特征向量,常用的变换有 Fourier 变换、 KL变换、小波变换等)、不变矩特征、全局笔划方向特征等;常用的局部统计特征有:局部笔划方向特征、 Gabor 特征等。 统计特征对微小的畸变不敏感,但区分相似的能力较差。 以下为程序设计中对小波分析提取低频部分的统计特征的实例 : f=imread(39。 39。 )。 输入图像 基于 神经网络的手写数字系统的设计与实现 第三章 特征提取 11 [c,s]=wavedec2(h,3,39。 db239。 )。 对人脸图像进行 3 阶小波分解,并提取小波系数 wave2gray(c,s,8)。 显示小波分解后各子图 y=wavecopy(39。 a39。 ,c,s) figure,imshow(mat2gray(y))。 提取主要特征 结构特征 采用结构特征 [12]对字符进行结构分析从而达到识别目的,是一种非常直观的方法。 字符由各个子部件构成,逐级分析字符图像的结构,根据各元素的属性、数量及其相互关系,便可判定待识字符。 与统计方法相比,结构分析不注重特征的绝对位置,只考虑特征的相对关系,因而对书写风格的变化不敏感,其缺点在于特征提取和模板的建立都十分困难,匹配算法也比较复杂,神经网络的应用弥补了 这个缺点,只要提取出适当的结构向量作为神经网络的输入向量,会得到令人满意的识别输出结果。 以下详细介绍。 结构特征提取 首先对经预处理后的图像进行分割,如图 所示。 图 图像分割 对图像分割后,结构特征提取的算法如下: (1)对细化后的数字图像取竖直的三条直线 ,分别取在 5/12,1/2,7/12处 ,记下这三条竖直直线与数字笔段的交点数。 (2)再取水平三条直线 ,分别取在 1/3,1/2,2/3 处 , 分别记下这三条水平直线与数字笔段的交点数。 (3)再取对角两条直线 , 分别记下 这两条对角直线与数字笔段的交点数。 笔划特征的提取 经细化后的数字图像其特征较为稳定 ,且笔划简单 ,因此对其抽取的基本结构组件能反映数字的本质特征 ,从而可快速有效地识别数字 ,并达到较好的分类效果。 数字端点如图。 基于 神经网络的手写数字系统的设计与实现 第三章 特征提取 12 图 对图像分割后,结构特征提取的算法如下: (1)按从上到下 ,从左到右的顺序扫描预处理后图像并选择黑像素点 P; (2)计算像素 P的 8-邻域之和 N; (3)若 N=1,则像素 P为端点 ,端点计数器加一; (4)重复步骤 (1)(3),直到遍历整个图像。 数字的特征向量说明 依据上述特征提取方法 ,本系统中的特征矢量由 9个分量组成 ,其排列如下所示 : DATA=[ 竖直中线交点数, 竖直 5/12 处, 竖直 7/12 处, 水平中线交点数 , 水平 1/3 处交点数, 水平 2/3 处交点数, 左对角线交点数, 右对角线交点数, 端点数 ]。 知识库的建立 由于本文采用的是基于模式知识库的识别方法,所以对字符的结构特征的分析以及字符模型的构造是一个十分重要的环节,图 就是对识别数字的标准形态进行具体分析而构造的模板。 图 规范手写体数字形态 以下为规范手写体数字形态的特征向量: DATA01= [2,2,2,2,2,2,2,2,0]; DATA11= [1,0,0,1,1,1,1,1,2]; DATA21= [3,3,3,1,1,1,1,1,3]; 基于 神经网络的手写数字系统的设计与实现 第三章 特征提取 13 DATA31= [3,2,3,1,1,1,2,2,3]; DATA41= [1,1,1,2,2,1,3,2,4]; DATA51= [3,3,3,1,1,1,2,2,4]; DATA61= [3,3,2,1,1,2,3,2,1]; DATA71= [2,2,2,1,1,1,1,1,2]; DATA81= [4,4,4,2,2,2,2,2,0]; DATA91= [3,3,3,1,2,1,3,1,1]。 由于本系统是对自由手写体进行识别 , 因而要考虑数字书写体的多变性。 通过对图。 图 以下为手写体数字变体形态的特征向量: DATA02= [1,1,2,2,2,2,1,2,2]; DATA22= [3,2,2,1,1,1,1,3,2]; DATA32= [3,1,4,2,1,1,2,2,3]; DATA42= [1,2,2,3,3,1,2,2,2]; DATA52= [3,3,3,1,1,1,2,2,4]; DATA62= [3,1,3,1,1,2,2,2,2]; DATA82= [4,4,4,2,1,2,1,2,2]; DATA92= [3,2,3,2,1,1,3,1,3]。 最后得到的知识库由上述两套模板所组成。 基于 神经网络的手写数字系统的设计与实现 第四章 神经网络在数字识别中的应用 14 第四章 神经网络 在数字识别的应用 神经网络简介及其工作原理 人的智能来自于大脑,大脑是由大量的神经细胞或神经元组成的。 每个神经元可以看作为一个小的处理单元,这些神经元按照某种方式互相连 接起来,构成了大脑内部的生理神经元网络。 他们中各神经元之间连接的强弱,按照外部的激励信号作自适应变化,而每个神经元又随着接收到的多个激励信号的综合大小呈现兴奋或抑制状态。 神经网络概述 人工神经元网络是生理学上的真实人脑神经网络的结构和功能,以及若干基本特性的某种理论抽象、简化和模拟而构成的一种信息处理系统。 从系统观点看,人工神经元网络是由大量神经元通过极其丰富和完善的联接而构成的自适应非线性动态系统。 由于神经元之间有着不同的连接方式,所以组成不同结构形态的神经网络 [14]系统是可能的。 据现在 的了解,大脑的学习过程就是神经元之间连接强度随外部激励信息做自适应变化的过程,大脑处理信息的结果确由神经元的状态表现出来。 显然,神经元是信息处理系统的最小单元。 虽然神经元的类型有很多种,但其基本结构相似。 神经网络的工作原理 人工神经网络首先要以一定的学习准则进行学习,然后才能工作。 现以人工神经网络对手写“ A”、“ B”两个字母的识别为例进行说明,规定当“ A”输入网络时,应该输出“ 1”,而当输入为“ B”时,输出为“ 0”。 所以网络学习的准则应该是:如果网络做出 错误的 判决,则通过网络的学习,应使得 网络减少下次犯同样错误的可能性。 首先,给网络的各连接权值赋予 (0, 1)区间内的随机值,将“ A”所对应的图像模式输入给网络,网络将输入模式加权求和、与门限比较、再进行非线性运算,得到网络的输出。 在此情况下,网络输出为“ 1”和“ 0”的概率各为 50%,也就是说是完全随机的。 这时如果输出为“ 1” (结果正确 ),则使连接权值增大,以便使网络再次遇到“ A”模式输入时,仍然能做出正确的判断。 如果输出为“ 0” (即 为 结果错误 ),则把网络连接权值朝着减小综合输入 加权值 的方向调整,其目的在于使网络下次再遇到“ A”模式输入时,减 小犯同样错误的可能性。 基于 神经网络的手写数字系统的设计与实现 第四章 神经网络在数字识别中的应用 15 如此操作调整,当给网络轮番输入若干个手写字母“ A”、“ B”后,经过网络按以上学习方法进行若干次学习后,网络判断的正确率将大大提高。 这说明网络对这两个模式的学习已经获得了成功,它已将这两个模式分布地记忆在网络的各个连接权值上。 当网络再次遇到其中任何一个模式时,能够做出迅速、准确的判断和识别。 一般说来,网络中所含的神经元个数越多,则它能记忆、识别的模式也就越多。 神经网络的学习与训练 人脑中一个典型神经元通过许多树突的精细结构,收集来自其它神经元的信息,神经元又通过轴突的一条长而细 的 轴突 发出电活性脉冲。 轴突分裂上千条分支,在每条分支末端,通过突触的结构把来自轴突的电活性变为电作用,从而使与之相连的各种神经元的活性受到抑制或兴奋。 当一个神经元收到兴奋输入,而兴奋输入又比神经元的抑制输入足够大时,神经元把电活性脉冲向下传到它的轴突,改变轴突的有效性,从而使一个神经元对另一个神经元的影响改变,便发生了学习行为。 因此,可以认为神经网络学习的本质特征在于神经细胞特殊的突触结构所具有的可塑性连接,而如何调整连接权重就构成了不同的学习算法。 通过向环境学习获取知识并改进自身性能是 NN的一个重要特 点。 在一般情况下,性能的改善是按某种预定的度量通过调节自身参数(如权值)随时间逐步达到的。 学习方式 [15](按照环境提供信息量的多少 )有三种: 1.监督学习(有教师学习) 为了使神经网络在实际应用中解决各种问题,必须对它进行训练,就是从应用环境中选出一些样本数据,通过不断地调整权矩阵,直到得到合适的输入输出关系为止,这个过程就是对神经网络的训练过程,这种训练的过程需要有教师示教,提供训练数据,又称样本数据。 在训练过程中又需教师的监督,故这种有教师的学习又称为监督式学习。 有教师学习方法虽然简单,但是要求教师 对环境和网络的结构应该比较熟悉,当系统复杂,环境变化时,就变得困难。 为了适应环境变化就要重新调整加权值,这样,当学习到新知识的同时,也容易忘掉已学过的旧知识,这一些是有教师学习方法的缺点。 2.非监督学习(无教师学习) 非监督学习时不存在外部教师,学习系统完全按照环境提供数据的某些统计规律来调节自身参数或结构(这。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。