车牌字符识别毕业设计(编辑修改稿)内容摘要:

响到图像识别分类器的设计、性能及其识别结果的准确性。 特征选择错误,分类就个能分得准确,甚至无法分类。 因此,特征选择是图像识别中的一个关键问题。 由于实际问题中常常不容易找到那些最重要的特征,或者某些图像特征还会随着环境的变化而发生变化,这就使得特征的选择和提取复杂化。 特征选择和提取的基本任务是如何从众多特征中找出那些最有效的特征。 在样本数量不是很多的情况下,用很多特征进行分类器设计,从计 算复杂程度和分类器性能来看都是不适宜的。 因此研究如何把高维特征宁间压缩到低维特征空间以便有效地识别图像成为一个重要的课题,例如手写体文字识别的特征选择的研究已将近半个世纪,但依然是一个研究的难点和热点。 为了进行识别,需要把图像从测量空间变换到维数大大减少的特征空间,被 第 9 页 识别的图像在这个特征空中就是由一个特征向量来表示。 为了方便起见,对几个经常用道的有关名词作一些说明。 1. 特征形成 根据待识别的图像,通过计算机产生一维原始特征,称之为特征形成。 2. 特征提取 原始特征的数量很大,或者说图像本身处于一个 高维空间中,通过映射 (或变换 )的方法可以用低维空间来表示样本,这个过程叫做特征提取。 映射后的特征是原始特征某种组合。 所谓特征提取在广义上说是一种变换。 3. 特征提取 从一组特征中挑选出一些最有效的特征以达到降低特征空间维数的目的,这个过程叫做特征选择。 目前几乎没有解析的方法能够知道特征的选择,很多情况下,凭直觉的引导可以列出一些可能的特征表,然后用特征排序的方法计算不同特征的识别效率。 利用其结果对表进行删减,从而选出若干最好的特征。 良好的特征应具备以下 4 个特点: (1) 可区别性。 对属于不同类的图像来 说,他们的特征应具备明显的差异。 (2) 可靠性。 对于不同类型的图像,特征值应该比较接近。 例如,杂志封面的文字图像的分割中,颜色是一个不好的特征。 因为,封面文字的颜色可以是各种色彩,尽管它们都属于文字图像。 (3) 独立性好。 所选择的特征之间彼此不相关。 例如细胞的曲径和细胞的面积高度相关,因为面积大致与直径的平方成正比。 这两个特征基本上反映的是相同的属性,即细胞的大小。 但是,有时相关性很高的特征组合起来可以减少噪声干扰,它们一般不作为单独的特征使用。 (4) 数量少。 图像识 别系统的复杂程度随着系统维数(特征 的个数)迅速增长。 尤为重要的是用来训练分类器和测试结果的图像样本随特征数量呈指数关系增长。 而且,增加带噪声的特征或与现存特征相关性高的特征实际上会使识别系统的性能下降。 实际应用中特征提取过程往往包括:先测试一组自觉上合理的特征,然后减少成数目合适的满意集。 通常符合上述要求的理想特征是很少甚至没有的。 第 10 页 对计算机图像识别系统而言,物体的形状是一个赖以识别的重要特征。 一个图像形状和结构特征有两种形式,一种是数字特征主要包括几何属性(如长短、面积、距离和凹凸特性等),统计属性(如黑色像素点在垂直方向的投影)和拓扑 属性(如连通、欧拉数);另一种是由字符串和图等所表示的句法语言。 它可以刻画某一图像不同部分之间的相互关系(如文字识别中的笔划关系),也可以描述不同目标间的关系。 由于感兴趣的是图像的形状和结构特征,所以其灰度信息往往可以忽略,只要能将它与其他目标或背景区分开来即可。 常用的一种技术是二值化图像,即将感兴趣的部分(区域或边界)标以最大灰度级,把背景(也包括其他任何不感兴趣的部分)标以最小灰度级,通常为零。 二值化图像在形状和结构分析中占有很重要的地位,本节讨论的算法如没有特别说明都是基于二值化图像的。 区域内部的数字特征 1. 矩 给定二维连续函数 f(x,y),下式定义了其 pq 阶矩: () 矩在文字识别中作为有效统计特征而被广泛运用,它之所以能被用来表征一幅二维图像是基于下面的帕普利斯( Papoulis)惟一性定理:如果 f(x,y)是分段连续的,只在 xy 平面的有限部分中有非零值,则所有各阶矩皆存在,并且矩序列{Mpq}此才惟一地被 f(x,y)所确定,反之 {Mpq}也唯一地确正 f(x,y)。 对一幅二值图像 { f(x,y):i,j=0,1,2„ N1}来说,上述条件无疑可被满足。 因此,可定义其 pq 阶矩为: Mpq=∑∑ f(i,j)ipjq () 不同 p、 q 值下可以得到不同的图像矩 Mpq。 ,常用的区域矩特征有以下几个: (1) 质心 () (2) 中心矩 () (3) Hu 矩组 第 11 页 Hu 矩组 是 {mpq}个矩的函数,它满足平移、旋转不变性,因而可被广泛地应用于区域形状识别中。 M1=m20+ m02 M2=(m20- m02)2+ 4m112 M3=(m30- 3m12)2+ (3m21+ m03)2 M4=(m30+ m12)2+ (m21+ m03)2 M5=( m30- m12)( m30+ m12) (m30+ m12)2- 3(m21+ m03)2 + ( 3m12- m03) (m21+ m03) 3(m30+ m12)2- (m21+ m03)2 M6=(m20- m02) (m30+ m12) 2 - (m21+ m03)2 + 4m11 (m30+ m12)(m21+ m03) M7=(3m12- m30)( m30+ m12) (m30+ m12) 2 - 3(m21+ m03)2 + (3m21- m30)( m21+ m30) (m03+ m12) 2 - 3(m12+ m03)2 如果上述的 7 个 Hu 矩中的 mpq用 来代替,则得到的矩还可以满足尺度不变性。 特别地, M7满足镜像对称不变性。 (4) 面积 区域的面积定义为区域中的像素点数: () 其中 max 为一位图像的最大灰度级。 (5) 扁度 扁度定义为区域的长短轴之比: () 根据帕普利斯的定理,将要无穷多的 mpq序列才能确定 f(x,y)。 在实际应用中 ,这是不可能实现的,通常取前几阶矩即可,但是这会带来误差。 2. 投 影 投影的示意图如图 21 所示。 图像的数为 {f (x,y)}。 S 为投影方向, t为与 第 12 页 其垂直的方向, t 与 x 轴夹角为 ө,则 {f (x,y)}沿着 S 的投影定义为: () 当 ө 固定时, p(t, ө)为t的函数,亦即一个一维波形。 不断地从 0~2∏变换 ө,可得到在不同方向上 {f (x,y)}的投影。 S y (x,y) t ө ө ө x 图 坐标投影 (t,s)与原坐标系 (x,y)间的对应关系 由投影定理,对满足一定条件的 {f (x,y)}, 如果知道全部方向上的 {p(t, ө)},就可以唯一地恢复 {f (x,y)},然而统矩方法一样,获得所有方向上的投影在实际应用中是行不通的。 通常取若干个特定方向上的投影作为以 {f (x,y)}形状特征度量,特别地,在 x 轴和 y轴上的投影定义为: () () 应用投影定理,可以把二维图像的问题转变为一维的曲线波形的问题。 3.欧拉数 图像的欧拉数是图像的一中拓扑性质度量,它表明了图的连通性。 欧拉数定义为一个图中或一个区域中的孔数 H 和连接部分数 C的差: E=C- H。 对数字降像而言,如果图像的背景用 0标记,目标物体用 1记,则欧拉数可用下式计算: () n(1)表明图像中像素点均数 目, 表示二位图像中具有垂直相邻两个 1标记的状态记数, n(1 1) 表示具有水平相邻 1 标记的状态记数, 表示 4 个 第 13 页 1 标记相邻的状态记数。 (1) 面积和周长 面积 S和周长 L是描述区域大小的基本特征。 计算图像中某个区域的面积以及该区域的周长,根据它们的比值可以分析或提取该区域所代表的图像形状特征。 粗略地说,图像中的区域面积S就是图像中相同标记的像素数目。 由于连续图像采用离散的像素点描述时,产生了误差。 例如一个包含 50 个像 素的对角线比一个 50 个像素的水平直线要长。 因此,在计算血积的过程中对每一个不同像素模式加上不同的权值,以减少误差。 区域的周长二用区域中相邻边缘点间的距离之和来表示,同样存 在误差补偿的问题。 (2) 圆形度 R 圆形度用来表示目标物体形状接近圆形的程度,其计算公式为: () 式中 S为区域的面积, L为周长, R的取值范围为 0〈 R≤ 1, R越人,则区域越接近圆形。 以连续的圆形,正方形和正三角形为例,它们的圆 形度 R分别为:圆形 R= 1,正方形 R= ,正三角形 R=。 (3) 凹凸特性 凹凸特性时区域的基本特性之一。 区域的凹凸性可以通过以下方法进行判别:区域内任意两像素间的连线穿过区域外的像素,则此区域为凹形。 相反,区域内任意两像素间的连线不穿过区域外的像素,则称为凸形。 在粘连字符的切分和文字识别等领域,经常利用宇符轮廓的凹凸特性分析其特征, 基于边界的形状特征 1.傅立叶描绘子 对于边界来说,最重要的是组成边界的点的位置信息。 灰度信息完全可以忽略。 因此可以将边界看成是直角坐标下的点集构成 的曲线 y=f (x,y),其中 x 是横坐标, y 是纵坐标。 可利用傅立叶变换描述 y=f (x,y),这一方法称为傅立叶描绘 第 14 页 子。 (1) Zahn 描绘子 若以 y=f (x,y)直接进行傅立叶交换,则变换的结果将与具体的 x 和 y 坐标值有关,不能满足平移和旋转的不变性要求。 为了解决这个问题,引入封闭曲线本身的内禀参量构造曲线方程,再做傅立叶交换。 由于边界通常是封闭曲线。 设 r 是顺时针方向的封闭曲线。 引入曲线本身的内禀参量即曲线弧长 l 构造曲线方程,它的参数表达式为 z(l)=(x(l),y(l)) () 式中 0≤ l≤ L, L 是曲线全长。 曲线的初始点为 l= 0, ө(l)是曲线弧长为 l 的点的切线方向。 定义: φ(l)= ө(l)- ө(0) () 则 φ(l)的变化规律可以描述封闭曲线的形状,很明显它是平移和旋转不变的。 由于 φ(l)不是一个周期函数,为将其变换为周期函数引入另一个变量 则 tЄ[0,2Π]。 可定义为: φ*(t)= φ(tL/2Π)+t tЄ[0,2Π] () 则 φ*(t)是 [0,2Π]的周期函数,而且它对封闭曲线 r 的平移、旋转和尺度都是不变的。 构造 rφ*(t)间的对应关系是一对一的,即介尺度变化下是相似的,如果反演 φ*(t)r,则可得出一组相似的封闭曲线。 由于 φ*(t)是周期函数,因此可用它的傅立叶系数来描述它,在 [0,2Π]上展成傅立叶级数为: () 其中: () () () 其中 n=1,2,„。 第 15 页 φ0 V1 Vm=V0 V2 △ lm Vm1 φ1 V3 φ2 图 数字图像下的多边形边界 数了图像中,封闭曲线。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。