毕业论文改web中图像的检索技术研究(编辑修改稿)内容摘要:

、颜色矩 等多种表征图像特 点 的方法,但是 如果 要突破对低层次特征的分析,实现更 加 高语义上的检索,实现难度 比较 大,进展 缓 慢。 但是 ,基于内容的图像检索建立在多媒体信息 内容语义上,可以 更为客观地反映媒体本质的特征。 (3)基于文本内容结合的检索研究 融合 文本和内容, 二者虽 然 侧重不同但却互相补充。 假如 能将二者结合起来取长补短,则网 络图像检索技术必 然 有新的进展。 现有 的图像搜索引擎在信息的自动加工和标引方面都 有 提高 空间 ,需要开发出计算机自动识别 、 标引图像的算法和技术, 用以完善现有的检索功能,并与已有 成熟的图像库检索技术相 融合 ,这是今后 需要 研究的一个课题。 并且 ,图像库检索技术也 应当 面向网络,利用网络技术进行改造,提供新的 万维网访问界面 以 代替原来的应用系统界面。 同时 把 巨大的图像库资源利用网络实现共享 (4)对基于内容编码技术的研究 可以 这么 说,三个方向都是相互影响 相互 促进的,任何一个方向的进展都 能够 促进图像检索技术向前 精进 一步。 当今,国 际上还没有通用 基于内容的编码标准。 20 世纪 90年代初,国际上就 已经开 始 对基于内容的图像信息检索 这 一 方面的研究。 从 最 基本的颜色检索,到综合利用多种图像特征进行检索, 很多 原型系统已经推出,其中, 有 部分已投入到实际应用中以检6 验其有效性。 与此 同时, MPEG7标准作为基于内容的多媒体编码标准也正在 规划 制定当中, 将要 成为国际标准中的一员。 所以 ,应尽快对 MPEG7 标准进行研究,分析其编码的 性质 ,在此基础上进一步研究基于内容检索的系统,使我国基于内容的图像检索 能够尽快走向实际应用 的 阶段。 (5)对用户查询接口的研究 这涉及到用户对图像内容感知表达、交互方式 设计、用户 要 如何形成并提交查询等方面。 现代多媒体信息系统 一个重要 的特征 就是信息获取过程 中 的可交互性,人在系统中是 主导地位。 除 开 提供示例和描绘查询基本接口 以 外,用户的查询接口应 当 提供丰富的交互能力,使用户在主动的交互过程中表达对图像语义的感知,调整查询参数及其组合,最终 能够 获得满意的查询结果。 用户的查询接口应该是 简单直观易用的,底层 特征选择对用户是透明的。 这里 会 涉及到如何把用户的查询表达转换 成 可以执行检索的特征矢量,如何从交互过程中获取用户的内容感知, 方便 选择合适的检索 特征等问题。 一个优秀的搜索引擎必须 能够 处理以下几个问题: (1)网页 分类 (2)自然语言 处理 (3)搜索策略 调度和协作 (4)面向特定用户 搜索。 所以 ,现在有很多的网络检索工具,就是说搜索引擎 使 用了智能的检索手段 用 来增强它的检索能力,而图片检索正是其中的一大块内容。 随着网上多媒体的 越来越 广泛应用,对图像的检索需求将会越迫切。 未来的图像检索技术将是网络技术和基于内容的图像库检索技术的 融合。 随着多媒体信息处理技术的日趋 发展和深化,图像信息加工、处理和检索标准的 陆续 出台,网上的图像检索技术 也会日趋完善,而图 像搜索引擎也将成为 网络 新宠。 第二章 基于 Web 的图像搜索 在网络技术和计算机技术 迅猛 发展、多媒体应用 愈发 普及的现在,图像检索和图像应用已成了 当 今网页中不可缺少的 一个 重要部分。 在能够实现对网页中文本信息提取的同时,如何再为用户抽取所需的图片资料是信息检索中一个值得研究的问题。 现有的检索技术基于关键词匹配进行检索,往往存在查不全、查不准、检索质量不高的现象,特别是在网络信息时代,利用关键词匹配很难满足人们检索的要求。 当然现在的人们也可以利用图像的内容特征去搜索所需的图片信息,但现在这项技术就是到现在也还不够成熟,其搜索效率还是不能令人满意。 7 如今在 Web 中处理图像检索有很多成熟的技术,如基于 Web的数据仓库、 Web 数据挖掘、 Web 数据源集成技术等。 为此,必须为 Web 建立适当的数据模型,利用数据模型有效地从 Web中获取信息。 为了处理 Web的中文数据,还必须使用一系列中文自然语言处理技术。 比较基础的技术有自动分词、人名和机构名的自动识别、自动标引等,其他像信息抽取、自动文摘、文档自动分类、中文概念词的自动发现以及概念词之间 的语义关系的确定等技术都必不可少。 实现上述技术需要扎实的积累和自然语言处理功底。 而如何利用现有成熟的传统的图片检索手段,研究出快捷方便而且能迅速提高检索效率的方法,本文将依据现有的搜索引擎和检索手段的研究找到网页中文本与图像之间的内在特点和联系,改进原有的文本搜索使用的模式和方法,提出新的文本相似的匹配算法,并引入检索的反馈技术,把这些技术引入到图像检索中,使得搜索手段更易于实现和提高检索效率。 文本与图像之间的关系 在文本检索中,搜索引擎主要考虑 Web 页中相关文字信息以及它的语义,这些文本信息反映 出网页的内容,但不完全与网页中图片的内容一致。 在 HTML 网页中,根据 HTML语言的格式,捕获反映图片信息的文字信息,分析这些文本的语义具有重要的意义。 如在 HTML 文档中 img标记以及其周围的文字信息,与网页中的插图的内容有着密切的联系。 表示图像内容的文本标记 为了能识别嵌入网页中图片的内容,必须仔细检索 HTML文档中能反映出图像内容的标记与其中的文本。 经过对 HTML网页格式的分析与对大量实际网页的研究,可知以下几个方面的标记与文本和图像内容有着最为密切的联系。 (1)图像的说明,这些文本出 现在图像的周围,用一句过多句话表示出图像的内容,当图像被置于表格中时,同一单元或相邻单元格内的文字也常用与表示图像的含义。 (2)图像的标题,通常用一个关键词表示图像信息。 (3)图像的标签,使用一段短语说明图片的摘要信息,图片无法显示时用标签的文本取代图片,显示摘要信息。 (4)网页的标题,该标题反映出网页的中心内容,作为表现网页内容的图片与网页的标题之间也有着一定的联系。 以上讨论的是 HTML中文档和嵌入网页中图像文本信息的关系,当然还存在其他的文本与多媒体信息和图像有关。 但是作为搜索引擎要考虑的方面, 既要保证抽取信息的准确性,也要兼顾程序执行中时间、空间的复杂度。 过多地引入与图像关系不是十分紧密的内容作为检索的依据,会引入检索时的躁声干扰,降低搜索效率。 8 文本的权值比较 以上讨论了网页中对图像信息的描述,在图像的检索中,首先是要建立描述图片内容。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。