基于聚类的智能图像分析算法毕业设计论文(编辑修改稿)内容摘要:

毕业设计(论文) 4 分类算法研究 :在理解算法原理的基础上运用算法,实现算法功能并分析比较算法性能。 智能图像分析软件实现 : 系统以 MatLab 为平台,通过用户界面形式实现了基于聚类的智能图像分类软件,具有建立根据现有图库训练网络、对任一图像实现分类并以图文结合方式展现分类结果等功能。 系统方案 论文以水果图像的分类为目标,通过图像的预处理、特征提取与分类,基于 MatLab实现图像的智能分析。 在图像预处理阶段,系统将对输入图像进行灰度化、中值滤波以及锐化并提取图像边缘的操作。 特征提取阶段, 系统将计算出输入图像的圆度、拉伸度、周长等中间值,将这些必要的中间值带入 Hu 特征迭代计算公式,即可获得后续处理所需要的特征值向量。 分类阶段, 系统为用户提供了选择界面。 当使用者选择 SVM 分类方法时,系统将通过使用图库训练学习的方式得到分类结果。 当使用者选择 Kmeans 分类时,系统将得到自主聚类的分类结果。 本文的结构 本文分为七个部分,各部分的内容依次如下: 第一章,绪论。 介绍要解决的主要问题问题。 第二章, 技术基础。 介绍 本文涉及到的知识以及使用的工具。 第三章,图像矩不变特征提 取。 对本文采用的训练特征进行详细介绍。 第四章,分类算法。 对本文用到的两类不同的分类算法进行详细介绍。 第五章,算法软件实现。 对系统涉及的核心算法、关键函数以及系 统界面进行详细的介绍。 第六章,系统测试。 第七章,结论与展望。 论文的成果总结及不足展望。 北京邮电大学本科毕业设计(论文) 5 第二章 技术基础 图像特征 图像特征指的是图像场中可用作图像标志的属性, 通常可以分为统计特征与视觉特征两大类。 统计特征包括 直方图 、 频谱和矩等 ,是人为特征,需要经过变换才能得到。 视觉特征指 的是 具有直观意义的图像的形状与颜色特征 , 如 颜色 、纹理、形状等。 图像特征的提取和分析是智能图像分析的关键步骤。 近年来,随着多媒体技术的发展,许多图像特征被研究人员发掘并利用,为进一步的图像处理提供了极大地便利。 对于某幅特定图像, 根据不同的需要,通常要提取其不同的特征,因而一幅图像又有了许多不同的表达方式。 也就是说,图像的不同特征从各个角度反映了图像在这个特定维度中的特点。 在图像统计特征中, 直方图 描述的是图片显示范围内 的 灰度 分布曲线 ,它的 横轴从左到右代表照片从黑(暗部)到白(亮度)的 像素数量。 频谱是以横轴纵轴的波纹方式,记录画出 图像中包含的 各种信号频率的图形资料 ,是图像信号的频域表征。 矩特征表征了图像区域的几何特征 ,又称为几何矩,其具有 平移 、 旋转 、尺度等特性的不变特征,又称其为不变矩。 也是本文中应用到得特征。 在视觉特征中, 颜色特征是一种全局特征 ,表征了图像区域所对应的景物的表面性质 ,是基于像素点的特征。 纹理特表征了图像区域所对应景物的表面性质征,也是一种全局特征 ,但是纹理特征不是基于像素点的特征,它需要在包含多个像素点的区域中进行统计计算。 形状特征由其集合属性(长短、距离、面积、凹凸 ) 、统计属性(投影)、拓扑属性(欧拉数、连通)表征,是图像最本质的特征反映。 不变矩特征由于其在图像平移、伸缩、旋转时均保持不变,而且具有全局性,是图像识别的主要方法,广泛的应用于机器视觉、目标识别与分类、纹理分析等等。 Hu 首先提出了七个几何不变矩用于图像识别,利用不变矩进行形状识别获得了广泛的应用。 后来人们进行了多方面的研究,发现不变矩还具有绝对的独立性,没有信息冗余现象,抽样性能好,抗噪能力强,更适合用于几何不变图像描述和识别。 本文就将使用到 Hu 的不变矩特征。 图像分类 方 法 图像分类概念 从人眼角度看, 提高图像对比对、增加视觉维度、进行空间变换或滤波,其目的就是让人们能够凭借知识和经验,根据图像色调、亮度、位置、纹理以及结构等特征,准确的对图像类型或者目标,做出正确的判断和解释,并根据当下的需求,对所需图像进行绘制处理。 图像分类就是通过计算机对图像进行定量的分析的过程,把图像中的各个像素或者北京邮电大学本科毕业设计(论文) 6 区域划归到若干类别中的一类去,以代替人眼的视觉判读。 图像分类的过程其实是一个模式识别的过程,是人眼目视判读的延续以及发展。 图像分类具有计算精度高、速度快、图像测量准确度高等特点。 图像分类原理 图像分类的理论依据是 : 图像中的同类景物在相同条件下,应具有相同或类似的光谱信息特征,从而体现出某种同类景物的某种内在相似性,即同类景物像素的特征向量将聚类于同一特征的空间区域,从而不同的景物的光谱信息特征和空间信息特征不同,它们将聚类于不同特征的空间区域。 从统计决策理论来看,图像分类在数学上就是对呈现统计可变的数据作出决策的过程。 将一个像素归入任一类别的决策,可以说是统计上的一种明智的“猜测”。 统计决策比较成熟,对模式不太复杂的应用已经相当的成功,但不能反映模式结构特性,概率表示形式使使用上也存在局限性。 神经网络分类方法是只 能信息处理的重要内容,它可以处理一些环境复杂、背景不清楚、推理规则不明确的问题。 图像分类 方 法 用统计方法进行图像分类时,首先从待分类对象中提取能够反映对象属性的特征向量,并将这些向量定义在一个特征空间之中。 之后运用统计决策的方法对特征空间进行划分,用以区分不同特征对应的对象,进而达到分类的目的。 同时,在分类的过程中,按照有无样本学习可以分为非监督分类法和监督分类法。 监督分类就是用已知的类别样本选择特征参数和建立判别函数,对各个像素进行分类。 通常意义上的监督分类包含以下 两 个具体的分类方法。 1. 最小距离分类法 最小距离分类法是最简单的监督分类方法。 这种方法的基本思想是:从训练样本中提取各个类别对应的均值向量并求出待测向量到各个均值向量的距离,比较后将待测类别归入距离最小的一类中。 设待分类像素 Tnxxxx ]...[ 21 到类别 i 的距离为 式( 21) 其中, m 为类别数, iz 为类 i 的中心。 当 则 ix }{min1 jmji dd |||| ii zxd  )( mi ,...,2,1北京邮电大学本科毕业设计(论文) 7 2. 最大似然分类(多类分类) 最大似然 分类建立在贝叶斯准则上,其分类正确率最高,是风险最小的判决分析。 在 n 维特征空间中,待测像素 Tnxxxx ]...[ 21 对于类 i 的条件概率密度函数 )/( ixP  和类i 的先验概率 )( iP 均已知,则最大似然分类法建立的判别函数集为 : )/()()( iii xPPxD  ( mi ,...2,1 ) 式( 22) 若 )}({m in)( 1 xDxD jmji  则 当 x 服从高维正态分布 时 ,有 )]()(21e xp[||)2( 1)/( 1212 iiTii zxzxixP n   式( 23) 而非监督分类则需要在进行分类之前获得类别的先验属性,通过这个属性求出判别函数中的未知参数。 在先 验属性未知的情况下将所有样本就将所有样本划分为若干个类别的方法称为费监督分类,这种方法是根据像素间的相似度大小进行聚类。 在聚类过程中,通常是按照某种相似性准则来对样本进行合并或分离。 像素聚类有两种途径:迭代法与非迭代法。 迭代法先给定一个初始分类,然后通过迭代算法找到能够使准则函数取极值的最优聚类结果,因此这是一个动态聚类分析过程。 常用动态聚类法有 Kmeans 算法、 LBG 算法和分裂算法。 MatLab 及图像智能处理工具箱 MatLab 是 Matrix Laboratory(矩阵实验室) 的缩写,是一款由美国 Math Works 公司出品的商业 数学软件。 MatLab 是一 款 用于数据可视化、算法开发、数据分析以及数值计算的高级技术计算语言和交互式环境。 除了矩阵运算、绘制函数 /数据图像等常用功能外, MatLab 还可以用来创建 用户界面 及与调用其它语言(包括 C, C++和 FORTRAN)编写的程序。 尽管 MatLab 主要用于数值运算,但利用为数众多的附加工具箱( Toolbox)它也适合不同领域的应用,例如图像处理、控制系统设计与分析、信号处理与通讯、金融建模和分析等。 另外还有一个配套软件包 Simulink,提供了一个可视化开发环境,常用于系统模拟、动态 /嵌入式系统开发等方面。 本系统的功能实现就是是借助 MatLab 的工具箱完成的。 Vapnik经过多年研究,提出了统计学理论和一种新的经验建模工具:支持向量机( Support Vector Machine,SVM)。 SVM 的训练是依据统计学理论中的结构风险最小化原则,在最小化经验风险的同时最小化 SVM 的模型复杂度,提高了模型的泛化能力。 尽管如此, SVM 训练为一个有约束的二次规划问题,其约束条件数等于训练样本容量,因此在用于大训练样本容量的建模ix 北京邮电大学本科毕业设计(论文) 8 问题时,会导致训练时间过长。 针对 SVM 这一缺点, Suykens 提出了损失函数为二次函数,约束条件为等式形式的支持向量机:最小二乘支持向量机( Least Squares Support Vector Machine,LSSVM)。 LSSVM 的训练问题为一个线性方程组求解问题,相对于 SVM训练的二次规划问题求解,其计算量有了很大的降低。 此次系统所用的工具包为由比利时鲁汶大学的 发的 LSSVMlab Toolbox( Version )。 此工具箱实现了基于 SVM 算法的多类分类。 此外,在展现运行结果时用到了 MatLab 中的 GUI 用户界面设计。 图形用户界面( Graphical User Interface,简 称 GUI,又称图形用户接口)是指采用图形方式显示的 计算机 操作 用户接口。 北京邮电大学本科毕业设计(论文) 9 第三章 图像矩不变特征提取 常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征。 一 颜色特征 (一)特点:颜色特征是一种全局特征 ,描述了图像或图像区域所对应的景物的表面性质。 一般颜色特征是基于像素点的特征,此时所有属于图像或图像区域的像素都有各自的贡献。 由于颜色对图像或图像区域的方向、大小等变化不敏感,所以颜色特征不能很好地捕捉图像中对象的局部特征。 (二)常用的特征提取与匹配方法 颜色直方图。 其优点在于:它能简单描述一幅图像中颜色的全局分布,即不同色彩在整幅图像中所占的比例,特别适用于描述那些难以自动分割的图像和不需要考虑物体空间位置的图像。 其缺点在于:它无法描述图像中颜色的局部 分布及每种色彩所处的空间位置,即无法描述图像中的某一具体的对象或物体。 (三) 常用的颜色空间: RGB 颜色空间、 HSV颜色空间。 颜色直方图特征匹配方法:直方图相交法、距离法、中心距法、参考颜色表法、累加颜色直方图法。 二 纹理特征 (一)特点:纹理特征也是一种全局特征,它也描述了图像或图像区域所对应景物的表面性质。 但由于纹理只是一种物体表面的特性,并不能完全反映出物体的本质属性,所以仅仅利用纹理特征是无法获得高层次图像内容的。 与颜色特征不同,纹理特征不是基于像素点的特征,它需要在包含多个像素点的区域中进行 统计计算。 在模式匹配中,这种区域性的特征具有较大的优越性,不会由于局部的偏差而无法匹配成功。 作为一种统计特征,纹理特征常具有旋转不变性,并且对于噪声有较强的抵抗能力。 但是,纹理特征也有其缺点,一个很明显的缺点是当图像的分辨率变化的时候,所计算出来的纹理可能会有较大偏差。 另外,由于有可能受到光照、反射情况的影响,从 2D 图像中反映出来的纹理不一定是 3D 物体表面真实的纹理。 (二)常用的特征提取与匹配方法 纹理特征描述方法分类 ( 1)统计方法统计方法的典型代表是一种称为灰度共生矩阵的纹理特征分析方法Gotlieb 和 Kreyszig 等人在研究共生矩阵中各种统计特征基础上,通过实验,得出灰度共生矩阵的四个关键特征:能量、惯量、熵和相关性。 统计方法中另一种典型方法,则是从图像的自相关函数(即图像的能量谱函数)提取纹理特征,即通过对图像的能量谱函数的计算,提取纹理的粗细度及方向性等特征参数 ( 2)几何法 所谓几何法,是建立在纹理基元(基本的纹理元素)理论基础上的一种纹理特征分北京邮电大学本科毕业设计(论文) 10 析方法。 纹理基元理论认为,复杂的纹理可以由若干简单的纹理基元以一定的有规律的形式重复排列构成。 在几何法中,比较有影响的算法有两种: Voronio 棋盘格特征法和结构法。 ( 3)模型法 模型法以图像的构造模型为基础,采用模型的参数作为纹理特征。 典型的方法是随机场模型法,如马尔可夫( Markov)随机场( MRF)模型法和 Gibbs 随机场模型法 ( 4)信号处理法 纹理特征的提取与匹配主要有:灰度共生矩阵、 Tamura 纹理特征、自回归纹理模型、小波变换等。 灰度共生。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。