基于matlab的数字识别系统设计论文(编辑修改稿)内容摘要:
i)=EB(i) i=1, 2, 3, 4.......M (式 42) 式中 Eb(i) 即自上而下扫描 i列图像时遇到的第一个黑色像素点的 y 轴坐标。 如果所在列无字符,即无黑色像素点,则该列 Eb(i)为 0。 12 根据上述定义检测到的索书号字符的上下轮廓如图所示。 在字符间的间隔处,则在上轮 廓存在凹结构,在下轮廓存在凸结构。 上轮廓的离散差分为, TDp(i)=Tp(i+1)Tp(i), i=1, 2, 3, 4.......M1 (式 43) 下 轮廓的离散差分为: BDp(i)=Bp(i+1)Bp(i), i=1, 2, 3, 4.......M1 (式 44) 如 果 TDp(j)0,TDp(j+k)0,若 k≥2,i∈ (j,j+k),TDp(i)=0,则在 [j, j+k】内必然存在唯一的凹结构, 如果 BDp(j)0,BDp(j+k)0,若 k≥2,i∈ (j,j+k),BDp(i)=0,则在 [j, j+k】内必然存在唯一的凸结构, 如图 41 所示为二值化的索书号图像的上轮廓和下轮廓曲线,在凹凸轮廓实际检测时,由于字符图像受噪声影响,字符的部分笔划边缘不光滑,会检测到一些仅有 1, 2 个象素深度或高度的假凹轮廓或假凸轮廓。 为了有效抑制笔划边缘不光滑的干扰影响,在检测过程中,增 加了一个约束条件,即凹轮廓的深度和凸轮廓的高度必须大于等于 3 个象素。 0 10 20 30 40 50 60 70 80 90 1000510152025303540上轮廓 0 10 20 30 40 50 60 70 80 90 100510152025303540下轮廓 图 41( a) 字符串上轮廓曲线 图 41( b) 字符串下轮廓曲线 4. 3. 2.字符高度和宽度的近似检测 根据上轮廓和下轮廓的定义,可以检测到各列字符高度 H(i): H(i)=ET(i) EB(i) (式 44) 取字符串的最大高度为字符的近似高度 Hw: Hw=max[H(i)] (式 45) 字符串图像的上下轮廓曲线表明: (1)非粘连字符的间隔处存在鲜明的凹凸结构; (2)绝大部分粘连字符在间隔处也会同样存在凹凸结构; (3)绝大部分水平笔划粘连的字符至少也会存在凹结构或凸结构。 因此,可以采用凹凸结构的间距近似检测单个字符的宽度 Gw. 由于凹凸结构受字符自身形状和粘连情况的影响,如 I, I, l(小写 L)和 1 等字符相对较窄, 而 M, N, V, W 等字符本身包含凹凸结构,从这 些字符检测到的问距会偏小,而水平笔划的字 符粘连会使检测到的间距偏大,所以取凹结构间距和凸结构间距的中间值作为单个字符的近似宽度。 设 n 个凹结构的位置集合为 {CT( 1), CT(2), ...CT(n)},凸结构位置集合为 {CB(1), CB(2), ...CB(m)},则凹结构和凸结构的间距分别为 : DCT(i)=CT(i)CT(i1),i=2,3,.......,n (式 46) DCB(i)=CB(i)CB(i1),i=2,3,.......,m (式 47) 为了将第一个凹结构和凸结构的间距包括在内,定义第一个凹结构和凸结构的间距为: DCT(1)=CT(1)Lc (式 48) DCB(1)=CB(1)Lc (式 49) 其中 Lc 为字符串的 起始列。 13 单个字符的宽度估计值为: Gw=med{DCT(1),...DCT(1),...DCB(1),...DCB(1)} (式 410) 由于受字符形态的影响,即使相同字体的字符,其宽度也有较大的变化,如字符 1和字符“ M”的宽度,而字符的高度保持基本保持一致。 因此,字符高度的检测比宽度检测更加准确,一般来说印刷体的字符高度和宽度之间满足如下关系; Gw= (式 411) 因此,如果当字符因干扰严重而无法准确检测到字符宽度时,根据上述 (414)式关系,建立字符 宽度检测的约束条件: ≤Gw≤ (式 412) 即当用凹凸结构轮廓检测的字符宽度不能满足式 (411)的约束关系时,用式 (412)估计字符宽度。 4. 3. 3.粘连索书号的切分 索书号字符粘连的类型主要是简单粘连。 上下轮 廓的凹凸结构位置作为可能的切分列,在如 在约束条件的作用下进行切分: 同一索书号的字符尺寸大小相同,则每个字符的宽度 Lw 应该在一定范围内,即 : ≤Lw≤ (式 413) 在上述约束条件的作用下,切分算法如下所示。 切分的步骤如下: 第一步:为非粘连字符的切分。 检测上轮廓的凹结构,若第 i 个凹结构的 Tp(CT(i))=0,则 i 凹结构为非粘连字符的间隔,切分后所得的字符区域为 {Pl, P2.......Pn)。 第二步:在上述切分的基础进行粘连字符的切分。 .字符笔画变形的修复 粘连字符的切分是对字符变形的纠正,但并不是正确的切分就能完全修复字符笔划的变形。 如图 55 所示,正确的切分后,字符“ 3”的变形。 由于索书号字符串的字符笔划宽度接近相等, 粘连笔划切分后同样应该满足该条件 : Rw=min{SL/SR,SR/SL} (式 414) 若 Rw≤,若 Rw≤ ,则消除 笔划宽度较小的笔划。 有时切分,会使上式中的 SR 或 SL 为 0,无法进行计算分析,因此,当其中任意一值为 0时,则令 Rw=1。 经过笔划修复后,字符‘ 3’可以回复笔划形。 实验结果分析 字符宽度和高度的估计准确与否直接影响算法的切分结果。 首先验证算法对字符宽度和高度估计的准确性。 由于不同尺寸大小、不同字符的文字笔画粗不同,而且受文字结构自身变化的影响即使同一个文字,其字符宽度也不是保持某一个恒定的值。 为此,采用 Wo+1 个像素的范围来衡量字符宽度估计的准确性。 索书号字符的估计宽度 Gw为 22 个象素,字符串中最大字符的宽度为 28 个象 素,晟小字符的宽度为 20 个像素,字符的估计高度 Hw为 29 个象素,字符串的字符宽度均在合 理范围内。 50 本书共有字符 377 个,若不考虑 1 和 J 等过窄字符,字符的真实宽度均在估计 范围内。 其中粘连的字符有 115 个,有 107 个准确切分,其中有 5 个字符经过切分后的笔划修复 回复字形, 8 个字符发生错误切分,切分准确率为 93% 通过实验和分析发现,粘连字符发生错误切分的主要类型是字符 M、 N 和 l、 T 以及 7 等发 生水平笔划粘连。 在凹凸轮廓结构分析选择切分路径时,容易在 M 和 N 的两边的竖直笔划处发 生错误切分。 如图所示为索书号二值图像的部分切割的字符。 14 图 42 字符‘ 4’ 图 43 字符‘ 7’ 图 44 字符‘ 3’ 15 5 字符识别 采用数字字符轮廓解构特征和统计特征相结合的方法,并从中选出稳定 的局部特征,理由结够语句识别的方法进行数字的识别,能够实现不同字体索书号多种字体数字的准确识别,同事还提高了识别的速度。 字符轮廓定义 由于受噪声和随机污点的干扰,以及二值化和粘连字符处理会一起字符的变形。 为了尽量减少这种变形对星系特征的干扰,或者从变形的字符中提取可靠的特征子女系,讲字符的整体轮廓分解为底部,顶部,左侧和右侧 4 个方向的轮廓特征来描述,是的当其中某部位的笔画发生变形是,不会改变或者减少对其他部位特征的影响。 左侧轮廓( LP(k),k=1,2.....M)定义为字符最左侧边界 像素点的遂平方向坐标值。 LP(i)=min{ x/P(x,y),y=i} i=1,2.....M (式 51) 式中 P(x,y)表示图像坐标为( x,y)的像素点,同理,右轮廓( RP(k),k=1,2...M) 定义为字符最右侧边界像素点的遂平方向坐标值。 RP(i)=min{ x/P(x,y),y=i} i=1,2.....M (式 52) 相应地,顶部轮廓( TP( k),k=1,2.......N)定义为字符最高边界像素点的垂直方向坐标值。 底部轮廓( BP( k),k=1,2.......N)定义为字符最低边界像素点的垂直方向坐标值。 TP(i)=min{ y/P(x,y),y=j} j=1,2.....N (式 53) BP(i)=min{ y/P(x,y),y=j} j=1,2....N (式 54) 为了描述轮廓的变化特征,定义四个方向轮廓的一阶微分: LPD=LP(i+1)LP(i) RPD=RP(i+1)RP(i) (式 55) TPD=TP(j+1)TP(j) BPD=BP(j+1)BP(j) 式中 i=1,2.....M1, j=1,2....N1 结构基元 索书号印刷体数字比较简单,可以由 5个基本基元组成,分别为:突变 (P)、竖直 (v)、左斜 (L)、右斜 (R)和圆弧 (C)。 左右两侧的轮廓,结构基元按照从上到下的顺序组合排列;顶部和底部轮廓的结构基元,按照从左到右的顺序组合排列。 以左则轮廓为例,定义上述基本单元: ( 1) 竖直 定义:假设 SL,SV和 SR分别表示某侧轮廓一阶微分值大于 0,等于 0,小于 0的个数,若 SR=0,SL=0,则解构为 V ( 2) 左斜 定义:假设 SL,SV和 SR 分别表示某侧轮廓一阶微分值大于 0,等于 0,小于 0的个数,若 SR=0,SL大于阈 值 TL,则解构为 L ( 3) 右斜 定义: 假设 SL,SV和 SR分别表示某侧轮廓一阶微分值大于 0,等于 0,小于 0的个数,若 SR=0,SL大于阈值 TR,则解构为 R ( 4) 圆弧 定义: 假设 SL,SV 和 SR分别表示某侧轮廓一阶微分值大于 0,等于 0,小于 0 的个数,若 SR大于 16 阈值 RT, SL大于阈值 LT,则解构为 C。 ( 5) 突变 连续的字符轮廓,其一阶微分值的变化量比较小,而当字符轮廓不连续时,其一阶微分值相对比较大。 因此,定义:当轮廓的异界微分值超过 PT 时则字符轮廓有突变,即为结构 P。 基元的检测。基于matlab的数字识别系统设计论文(编辑修改稿)
相关推荐
9 控制及仿真 PID控制器由于具有结构简单,容易实现,控制精度高等优点,广泛应用于工业控制过程中。 而工业控制过程本身由于机理复杂,时变,时滞等原因,其精确地数学模型很难得到,一些高阶对象通过降阶,一般用一阶或二阶惯性环节加纯延迟来近似。 但是在一个具有纯滞后的系统中,采用常规的PID控制时,存在的主要缺点是动态响应指标较差 [9]。 系统承受扰动后,往往会出现明显的超调,且调节时间也较长
u_date 创建日期 Date() 否 u_type 用户类型 Useradmin,reder,bookadmin,recordadmin 否 u_picurl 用户照片 Varchar(50) 否 u_password 用户密码 Varchar(20) 否 初始 1 此表的 设计是为了对不同身份的读者进行分类方便读者的管理 ,其中可借阅图书数量的属性设定
第 5页 共 20页 鼠标放置在元件端子处,但鼠标指针变为“ +”字形状时,按住鼠标左键移动至需要连线的另一元件端子处,当鼠标指针变为“ +”字形状时,松开鼠标左键及建立两端子之间的连线,若为控制模块间传递信号,则在连线端部将出现箭头表示信号的流向,不断重复该过程直 至系统连接完毕。 ( 6) 仿真电路或系统模型建立完毕后,还需要使用“ Simulink”菜单中的”Confihuration
庭的进程 持续发展使得社会轿车数量持续增长,对停车位的需求量剧增。 因此停车场的建设已成为绝大多数建筑项目不可或缺的一部分。 自动停车场可以减少大量的人力物力,提高人类的工作效率,可以改善城市的建设,减少城市乱停车的问题,解决交通问题。 随着汽车数量日益剧增,解决停车问题日益严重,尤其是居民小区、人型公共消费场所等,寸上如金,停车场向空间发展,已势在必行。 根据有关市场调查,目前在大中型城市对
数控制功能是 PLC 的最基本功能之一。 PLC 为用户提供了许多计数器,计数器计数到某一数值时,产生一个状态信号(计数值到),利用该状态信号实现对某个操作的计数控制。 数据处理功能 本科生毕业设计 第 8 页 PLC 大部分都具有数据处理功能,可以实现算术运算、数据比较、数据传送、数据移位、数制转换、译码编码等操作。 回路控制功能 有些 PLC 具有 A/D、 D/A 转换功能
( 6) IIR 滤波器主要是设计规格化,频率特性为分段常数的标准低通,高通,带通和带阻滤波器。 FIR 滤波器则灵活很多,例如:频率采样法可适应各种幅度特性和相位特性的要求,因此 FIR 滤波器可设计出理想正交变换器,理想微分器,线性调频器等各种网络,适应性很广,而且,目前已经有很多 FIR 滤波器的计算机程序可供使用。 表 21 两种滤波器特点比较分析 FIR滤波器 IIR滤波器 设计方法