基于颜色特征的图像检索王亚芬内容摘要:

容易把握,因所以要对定义一些标准和指标,优化检索结果的有效性。 一般地,图像检索分为两种主要类型:图像匹配和相似性查询。 设图像库有 N 幅图像。 对匹配问题,理想情况是正确图像是检索结果中的第一个。 通常用下面的式子评价匹配效果:匹配比率=检索性能的评价一般采用查准率-查全率(Precision-Recall)的相似检索评价准则,通过执行检索集合中的各个查询,就可以计算出查询的平均查准率和查全率,据此就可以给出系统的检索性能评价。 查准率和查全率的定义如下:v 查准率 Precision 定义为查询结果中与例子图像相关的图像所占的百分比例,Precision= 100%表示查询出图像均为相关图像。 Precision =v 查全率 Recall 定义为查询结果中与例子图像相关的图像占全部相关图像的百分比。 Recall= 100%表示全部相关图像均被检索出来。 Recall =查准率则反映检索的准确性,而查全率反映检索的全面性,因此可以用来评价系统的有效性。 查准率和查全率越高说明检索系统的效果越好。 但是查准率和查全率是一对矛盾,当查全率较高时,查准率就会降低,反之亦然。 因此一般检索系统要求通过调整,使查准率和查全率两者达到一个最优平衡。 排序评价方法如果图像匹配采用相似性比较,那么,根据不同的相似性尺度,返回的图像数目可能不同,此时采用该方法。 检索到的相关图像的平均排序为P1;检索到的相关图像的数目;所有实际的相关图像的排序号之和为 SUM;则有 理想的相关图像的平均排序P2;实际的相关图像数目N;则有 相关图像丢失率:R=在理想情况下,所有相关图像都排在最前面,因此,平均值越小,表明检索算法越好。 相关图像丢失率计算丢失的相关图像占所有相关图像的比例,这个值越小,表明成功率越高。 第二章 基于内容的图像检索 图像流的特点图像和视频信息与传统的文本、数值信息相比具有如下的特点:1)非结构化特性。 传统的文本、数值数据,记录信息具有明显的结构特性,它是现实世界中对象间关系的反映,可通过实体——关系模型抽象得到。 图像和视频对象具有较强的非结构化特性,许多多媒体信息以流的形式存在(例如视频流),这种媒体想要得到它的信息,必须对它先进行结构化处理,而这种结构化不能通过简单的抽象来完成,而需要相应的媒体分割和组织技术。 2) 内容多义性。 在传统的文本、数值数据库中,每一个记录所包含的语义确定而且有限。 而对于像图像或视频这样的多媒体对象来说,具内容往往对不同的用户、不同的应用具有不同的解释,即具有多义性的特点,这样其内容就很难通过有限的属性来充分描述。 此外,对多媒体对象的检索一般都是内容相似程度的检索——即查找内容描述与检索要求最接近的对象。 这就要求建立的内容描述支持内容相似性程度的比较,这是在传统的文本、数值数据库中广泛采用的定性描述所不能满足的。 CBIR的定义基于内容图像的检索主要依据图像的画面内容特征和主题对象特征来进行检索。 由图像分析软件对输入的图像先进行图像分析,根据图像自身所包含的颜色(灰度)、纹理、形状、空间关系等特征以及这些特征的组合,自动抽取特征,在将输入图像存入图像库的同时将其相应的特征向量也存入与图像库相连的特征库。 在进行检索图像时,对每一幅给定的查询图,进行图像分析,并提取图像特征向量,利用基于这些特征定义的特征度量函数计算或评价特征之间的相似性,将该图像的特征向量和特征库中的特征向量进行匹配,根据匹配的结果搜索图像库中将最相似的一些检索结果就可以提取出所需要的检索图,返回给用户。 基于内容的视觉信息检索的目的不是去理解或识别图像目标,它所关注的是能否基于内容快速发现信息,旨在对视觉信息提供强有力的描述,实现视觉信息的结构化,在用户可以接受的响应时间内从图像库中查询到符合要求的图像,最终达到用户对这些视觉信息内容自由访问的目标。 基于内容的图像检索过程充分体现了图像的信息特点又结合了图像处理、图像理解、数据库技术、计算机视觉(puter vision)、模式识别技术及神经网络等学科,同时也和人脑的认识程度紧密相关,这诸多因素使得基于内容的图像检索的研究成为一项极富挑战性的课题。 CBIR的分类按照检索时所基于的不同颜色特征,可将基于内容的图像检索技术分为如下四种类型:v 基于颜色特征的检索最基本的思想是利用颜色空间直方图的匹配,进一步研究集中在:表示颜色特征的颜色模型与人的视觉特征一致性研究。 降低表示颜色特征维数的方法。 与其它视觉特征结合进行多特征检索研究等几个方面。 v 基于纹理特征的检索其本质是刻画像素的邻域灰度空间分布规律,区分有相似颜色的区域,分割物体和背景。 它描述了图像或区域所对应景物的表面性质,包括表面结构组织及其与周围环境关系的许多重要信息。 并且,纹理特征是一种统计特征,有旋转不变性和较强的抗噪音能力。 v 基于形状特征的检索对形状特征的提取主要是寻找一些几何不变量,主要难在对图像中感兴趣目标的分割。 目前用于图像检索的形状描述方法主要有两类:基于边缘和基于区域的形状方法。 前者利用图像的边缘信息,而后者则利用区域内的灰度分布信息。 v 基于空间位置关系的检索是基于图像中对象所在的位置和对象之间的空间关系的研究。 空间关系是指空间对象之间具有空间特性的关系,主要包括拓扑、方向、度量关系。 空间关系特征的自动抽取非常困难的,所以大多采用人工绘制草图的查询方法。 CBIR的系统结构CBIR系统由5个子系统构成,包括图像数据的存储,特征提取,相似性度量,高维特征索引过滤技术,用户查询和浏览接口。 特征 索 引颜 色形 状纹 理空间关 系用户引擎领域知识图像源 图 像 库 查询 匹配 预处理 索引 结果 索引 相关反馈 过滤 用户 存储 相似度度量 索引 特征提取 子系统 子系统 子系统 子系统 子系统 CBIR的系统结构v 用户子系统是用户提交查询请求和接收浏览查询结果的接口。 提交查询的方式:关键词查找、浏览查找(通过等级式类目组织检索)、特征输入查找(设置特征参数)、草图查找、示例查询。 v 相似性度量子系统是检索引擎,利用图像的特征来度量图像之间的相似性,并按相似性的大小对结果图像集合排序,并返回给用户。 v 索引子系统主要功能是对图像数据作索引。 目前主要使用图像的特征作为索引,利用相似性度量获得相似结果集合。 图像特征主要用高维矢量来表示。 v 特征提取子系统功能是提取图像的特征,表达图像的内容。 目前主要以视觉特征为主,包括颜色特征,纹理特征,形状特征,物体空间关系特征等。 v 存储子系统负责存储和管理原始图像数据。 图像数据库中存储的信息有图像数据,特征索引数据和其他文本描述信息。 存储技术包括图像预处理技术和压缩技术等。 预处理技术是图像在入库之前的处理,包括滤出噪声,对比度调整,几何矫正和比例变换等。 压缩技术是节约图像数据占用空间的手段,系统需要支持各种不同的压缩格式和它们之间的相互转换。 CBIR的检索过程基于内容的图像检索是一个逐步求精的过程,大致可以经过以下几个步骤:v 查询要求用户查找一个数据对象时,利用系统人机界面提供的输入方式形成一个查询条件。 查询接口一般要对所提交的数据进行预处理,然后再传递给搜索引擎。 v 特征提取特征提取是以手工提取、半自动提取或自动提取的广度提取图像的颜色、纹理、形状等特征或它们的组合。 图像的特征,是人对图像视觉效果的量化表示,能较好的表征人对图像的视觉感受。 v 相似性匹配在选取了特征之后,将待识别的图像的特(查询特征)与数据库中的特征按照一定的匹配算法进行匹配。 将图像的特征看作是坐标空间中的点,通过距离度量函数计算两个点之间的接近程度来衡量图像特征间的相似度。 v 结果返回将满足一定相似性条件的一组候选结果按相似度大小排列后返回给用户。 v 特征调整对系统返回的结果可通过浏览来挑选,直至找到满意的结果,或从候选结果中选择一个示例,经过特征调整,形成一个新的查询。 如此重复,逐步缩小查询的范围,直到用户对查询结果满意为止。 特征提取相似性匹配返回候选结果满意。 输出检索结果用户查询说明示例、一般性描述从候选结果中选择一个示例修改用户查询说明 N Y CBIR的处理过程第三章 基于颜色的图像检索 颜色模型和颜色空间颜色是视觉系统对可见光的感知结果。 自然界中的任何一种颜色都可以由R、G、B这3 种颜色值之和来确定,它们构成一个三维的RGB矢量空间。 颜色模型(color model)是用数值方法指定颜色的一套规则和定义,可使人们方便地描述任何一种颜色,颜色模型通常用颜色空间描述,如RGB、CMY和CMYK,从这个意义上说,颜色模型和颜色空间互为同义词。 任何一种颜色都可用三种基本颜色按不同的比例混合得到,显示彩色图像用RGB相加混色模型:颜色=R(Red 百分比)+G(Green 百分比)+B(Blue 百分比)颜色空间是表示颜色的一种数学方法,人们用它来指定和产生颜色,使颜色形象化。 颜色空间通常用三维模型表示,空间中的颜色能够看到或者使用颜色模型产生。 颜色空间中的颜色通常使用代表三个参数的三维坐标来指定,这些参数描述的是颜色在颜色空间中的位置,其颜色要取决于使用的坐标。 颜色的度量体系颜色度量体系(color system),也叫做颜色制或者叫做颜色体制,实际上就是人们组织和表示颜色的方法。 组织和表示颜色的方法主要有两种:一种是颜色模型,一种是编目系统。 颜色模型是用简单方法描述所有颜色的一套规则和定义。 颜色空间是颜色模型最普通的例子,RGB、CIE XYZ、CIE LAB、CMYK等。 对于颜色空间的构造需要满足三个要求:v 完备性(Completeness),颜色空间应能描述人能感知的所有颜色;v 一致性(Uniformity ),颜色在空间度量的差异和感知的差异相吻合;v 唯一性(Uniqueness),颜色空间中颜色在感知上彼此不同。 RGB颜色空间RGB空间模型是使用红、绿、蓝的亮度值,大小限定到一定范围,如0255。 R、G、B以不同程度的混合可以调出各种各样的色彩,并都能用三维空间中第一象限的一个点来表示,如图的立方体所示,三色图像的灰度级直方图是RGB空间的点分布。 在RGB彩色空间的原点上,任何一种基色的亮度值都为0,即原点为黑色。 三基色都达到最高亮度时则表示为白色。 在连接黑色与白色的正方体对角线上,各原色的强度相等,产生由暗到明的白色,也就是不同的灰度值。 立方体位于坐标轴上的三个顶点分别为三基色红、绿、蓝色,而另外三个顶。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。