基于matlab的数字识别系统设计论文(编辑修改稿)内容摘要:

i)=EB(i) i=1, 2, 3, 4.......M (式 42) 式中 Eb(i) 即自上而下扫描 i列图像时遇到的第一个黑色像素点的 y 轴坐标。 如果所在列无字符,即无黑色像素点,则该列 Eb(i)为 0。 12 根据上述定义检测到的索书号字符的上下轮廓如图所示。 在字符间的间隔处,则在上轮 廓存在凹结构,在下轮廓存在凸结构。 上轮廓的离散差分为, TDp(i)=Tp(i+1)Tp(i), i=1, 2, 3, 4.......M1 (式 43) 下 轮廓的离散差分为: BDp(i)=Bp(i+1)Bp(i), i=1, 2, 3, 4.......M1 (式 44) 如 果 TDp(j)0,TDp(j+k)0,若 k≥2,i∈ (j,j+k),TDp(i)=0,则在 [j, j+k】内必然存在唯一的凹结构, 如果 BDp(j)0,BDp(j+k)0,若 k≥2,i∈ (j,j+k),BDp(i)=0,则在 [j, j+k】内必然存在唯一的凸结构, 如图 41 所示为二值化的索书号图像的上轮廓和下轮廓曲线,在凹凸轮廓实际检测时,由于字符图像受噪声影响,字符的部分笔划边缘不光滑,会检测到一些仅有 1, 2 个象素深度或高度的假凹轮廓或假凸轮廓。 为了有效抑制笔划边缘不光滑的干扰影响,在检测过程中,增 加了一个约束条件,即凹轮廓的深度和凸轮廓的高度必须大于等于 3 个象素。 0 10 20 30 40 50 60 70 80 90 1000510152025303540上轮廓 0 10 20 30 40 50 60 70 80 90 100510152025303540下轮廓 图 41( a) 字符串上轮廓曲线 图 41( b) 字符串下轮廓曲线 4. 3. 2.字符高度和宽度的近似检测 根据上轮廓和下轮廓的定义,可以检测到各列字符高度 H(i): H(i)=ET(i) EB(i) (式 44) 取字符串的最大高度为字符的近似高度 Hw: Hw=max[H(i)] (式 45) 字符串图像的上下轮廓曲线表明: (1)非粘连字符的间隔处存在鲜明的凹凸结构; (2)绝大部分粘连字符在间隔处也会同样存在凹凸结构; (3)绝大部分水平笔划粘连的字符至少也会存在凹结构或凸结构。 因此,可以采用凹凸结构的间距近似检测单个字符的宽度 Gw. 由于凹凸结构受字符自身形状和粘连情况的影响,如 I, I, l(小写 L)和 1 等字符相对较窄, 而 M, N, V, W 等字符本身包含凹凸结构,从这 些字符检测到的问距会偏小,而水平笔划的字 符粘连会使检测到的间距偏大,所以取凹结构间距和凸结构间距的中间值作为单个字符的近似宽度。 设 n 个凹结构的位置集合为 {CT( 1), CT(2), ...CT(n)},凸结构位置集合为 {CB(1), CB(2), ...CB(m)},则凹结构和凸结构的间距分别为 : DCT(i)=CT(i)CT(i1),i=2,3,.......,n (式 46) DCB(i)=CB(i)CB(i1),i=2,3,.......,m (式 47) 为了将第一个凹结构和凸结构的间距包括在内,定义第一个凹结构和凸结构的间距为: DCT(1)=CT(1)Lc (式 48) DCB(1)=CB(1)Lc (式 49) 其中 Lc 为字符串的 起始列。 13 单个字符的宽度估计值为: Gw=med{DCT(1),...DCT(1),...DCB(1),...DCB(1)} (式 410) 由于受字符形态的影响,即使相同字体的字符,其宽度也有较大的变化,如字符 1和字符“ M”的宽度,而字符的高度保持基本保持一致。 因此,字符高度的检测比宽度检测更加准确,一般来说印刷体的字符高度和宽度之间满足如下关系; Gw= (式 411) 因此,如果当字符因干扰严重而无法准确检测到字符宽度时,根据上述 (414)式关系,建立字符 宽度检测的约束条件: ≤Gw≤ (式 412) 即当用凹凸结构轮廓检测的字符宽度不能满足式 (411)的约束关系时,用式 (412)估计字符宽度。 4. 3. 3.粘连索书号的切分 索书号字符粘连的类型主要是简单粘连。 上下轮 廓的凹凸结构位置作为可能的切分列,在如 在约束条件的作用下进行切分: 同一索书号的字符尺寸大小相同,则每个字符的宽度 Lw 应该在一定范围内,即 : ≤Lw≤ (式 413) 在上述约束条件的作用下,切分算法如下所示。 切分的步骤如下: 第一步:为非粘连字符的切分。 检测上轮廓的凹结构,若第 i 个凹结构的 Tp(CT(i))=0,则 i 凹结构为非粘连字符的间隔,切分后所得的字符区域为 {Pl, P2.......Pn)。 第二步:在上述切分的基础进行粘连字符的切分。 .字符笔画变形的修复 粘连字符的切分是对字符变形的纠正,但并不是正确的切分就能完全修复字符笔划的变形。 如图 55 所示,正确的切分后,字符“ 3”的变形。 由于索书号字符串的字符笔划宽度接近相等, 粘连笔划切分后同样应该满足该条件 : Rw=min{SL/SR,SR/SL} (式 414) 若 Rw≤,若 Rw≤ ,则消除 笔划宽度较小的笔划。 有时切分,会使上式中的 SR 或 SL 为 0,无法进行计算分析,因此,当其中任意一值为 0时,则令 Rw=1。 经过笔划修复后,字符‘ 3’可以回复笔划形。 实验结果分析 字符宽度和高度的估计准确与否直接影响算法的切分结果。 首先验证算法对字符宽度和高度估计的准确性。 由于不同尺寸大小、不同字符的文字笔画粗不同,而且受文字结构自身变化的影响即使同一个文字,其字符宽度也不是保持某一个恒定的值。 为此,采用 Wo+1 个像素的范围来衡量字符宽度估计的准确性。 索书号字符的估计宽度 Gw为 22 个象素,字符串中最大字符的宽度为 28 个象 素,晟小字符的宽度为 20 个像素,字符的估计高度 Hw为 29 个象素,字符串的字符宽度均在合 理范围内。 50 本书共有字符 377 个,若不考虑 1 和 J 等过窄字符,字符的真实宽度均在估计 范围内。 其中粘连的字符有 115 个,有 107 个准确切分,其中有 5 个字符经过切分后的笔划修复 回复字形, 8 个字符发生错误切分,切分准确率为 93% 通过实验和分析发现,粘连字符发生错误切分的主要类型是字符 M、 N 和 l、 T 以及 7 等发 生水平笔划粘连。 在凹凸轮廓结构分析选择切分路径时,容易在 M 和 N 的两边的竖直笔划处发 生错误切分。 如图所示为索书号二值图像的部分切割的字符。 14 图 42 字符‘ 4’ 图 43 字符‘ 7’ 图 44 字符‘ 3’ 15 5 字符识别 采用数字字符轮廓解构特征和统计特征相结合的方法,并从中选出稳定 的局部特征,理由结够语句识别的方法进行数字的识别,能够实现不同字体索书号多种字体数字的准确识别,同事还提高了识别的速度。 字符轮廓定义 由于受噪声和随机污点的干扰,以及二值化和粘连字符处理会一起字符的变形。 为了尽量减少这种变形对星系特征的干扰,或者从变形的字符中提取可靠的特征子女系,讲字符的整体轮廓分解为底部,顶部,左侧和右侧 4 个方向的轮廓特征来描述,是的当其中某部位的笔画发生变形是,不会改变或者减少对其他部位特征的影响。 左侧轮廓( LP(k),k=1,2.....M)定义为字符最左侧边界 像素点的遂平方向坐标值。 LP(i)=min{ x/P(x,y),y=i} i=1,2.....M (式 51) 式中 P(x,y)表示图像坐标为( x,y)的像素点,同理,右轮廓( RP(k),k=1,2...M) 定义为字符最右侧边界像素点的遂平方向坐标值。 RP(i)=min{ x/P(x,y),y=i} i=1,2.....M (式 52) 相应地,顶部轮廓( TP( k),k=1,2.......N)定义为字符最高边界像素点的垂直方向坐标值。 底部轮廓( BP( k),k=1,2.......N)定义为字符最低边界像素点的垂直方向坐标值。 TP(i)=min{ y/P(x,y),y=j} j=1,2.....N (式 53) BP(i)=min{ y/P(x,y),y=j} j=1,2....N (式 54) 为了描述轮廓的变化特征,定义四个方向轮廓的一阶微分: LPD=LP(i+1)LP(i) RPD=RP(i+1)RP(i) (式 55) TPD=TP(j+1)TP(j) BPD=BP(j+1)BP(j) 式中 i=1,2.....M1, j=1,2....N1 结构基元 索书号印刷体数字比较简单,可以由 5个基本基元组成,分别为:突变 (P)、竖直 (v)、左斜 (L)、右斜 (R)和圆弧 (C)。 左右两侧的轮廓,结构基元按照从上到下的顺序组合排列;顶部和底部轮廓的结构基元,按照从左到右的顺序组合排列。 以左则轮廓为例,定义上述基本单元: ( 1) 竖直 定义:假设 SL,SV和 SR分别表示某侧轮廓一阶微分值大于 0,等于 0,小于 0的个数,若 SR=0,SL=0,则解构为 V ( 2) 左斜 定义:假设 SL,SV和 SR 分别表示某侧轮廓一阶微分值大于 0,等于 0,小于 0的个数,若 SR=0,SL大于阈 值 TL,则解构为 L ( 3) 右斜 定义: 假设 SL,SV和 SR分别表示某侧轮廓一阶微分值大于 0,等于 0,小于 0的个数,若 SR=0,SL大于阈值 TR,则解构为 R ( 4) 圆弧 定义: 假设 SL,SV 和 SR分别表示某侧轮廓一阶微分值大于 0,等于 0,小于 0 的个数,若 SR大于 16 阈值 RT, SL大于阈值 LT,则解构为 C。 ( 5) 突变 连续的字符轮廓,其一阶微分值的变化量比较小,而当字符轮廓不连续时,其一阶微分值相对比较大。 因此,定义:当轮廓的异界微分值超过 PT 时则字符轮廓有突变,即为结构 P。 基元的检测。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。