模式识别
根据票据图像的特点 1)通过综合字符笔画双边缘特征与背景抑制增强,来提取复杂背景下识别域子 图中的字符目标; 2)采用连通链结构来描述框线检测结果与字符目标提取结果融合后的框线区域,通过对交叠进行检测和标记,来判别字符与框线的交叠方式,并据此保留字符笔画去除框线干扰,还原待识别字串真实的面貌; 3)结合轮廓分析与拓扑结构分析,来确定粘连数字串的分割策略,对无限制手写数字字符串进行有效的切分。
知所属类别的的训练样本集,按它们特征向量的分布来确定假说 (通常为一个判别函数),只有在判别函数确定之后才能用它对未知的模式进行分类; – 对分类的模式要有足够的先验知识,通常需要采集足够数量的具有典型性的样本进行训练。 假说的两种获得方法(续) • 非监督学习、数据驱动或演绎假说:在解释空间中找到一个与特征空间的结构相对应的假说。 这种方法试图找到一种只以特征空间中的相似关系为基础的有效假说。
素 ,若 成立,则 有自反性。 对称性:若对 (x,y)∈ E E都有 则 有对称性。 矩阵对角线元素对称, μij= μji。 1000010000100001~=即 R~R ~R ~R~R1),(~ xxR成立),(),(~~xyyx RR ~R具有自反性对称性的模糊关系称为相似关系(或类似关系) 传递性 :若矩阵 中 有 : 具有自反性
i wxwd x第 19页 第 10讲 章毓晋 (THEEIE) 感知机 • 对模式矢量增加第 n + 1个元素 • 构建一个扩充模式矢量 y,让 yi = xi, i = 1, 2, …, n,且后面加一个元素 yn+1 = 1 其中 y = [y1 y2 … yn 1]T是个扩充模式矢量, w = [w1 w2 … wn wn+1]T是个权矢量 • 关键问题:用模式矢量的给定训练集确定 w
模式识别系统示意 在两个模块中都需要数据的预处理,而数据预处理功能是多方面的,如除去噪声信号的边缘影响;将研究有关的模式分离;对模式样品标准化等。 训练模式样本的特征数据输入过程,就是将已知的模式样品进行数值化后载入计算机。 这样对于输入样品进行分析,除去对分类无用或者易造成混淆的特征,尽量保留对分类判别有效的数值特征,于是完成模式识别的特征选择。