图像有损压缩技术的研究毕业论文内容摘要:

比以及通用存储性等功能。 在其结构上应具有适应性与可扩张 性,以适应软、硬件技术的不断发展,及时融合新的技术。 由于 MPEG4 的中心是基于内容与交互性的,它就不再对低码率范围做出特别要求。 MPEG4 在通信信息描述中,首次提出了对象的概念,如视频对象 VO( Video Object)、音频对象 AO( Audio Object)等,这是一个新的飞跃。 在编码方案上, MPEG4 仍是以块为基础的混合编码。 MPEG4 标准主要应用于视频电话、视频电子邮件和电子新闻等,其传输速率要求较低,在 ~ 64kb/s 之间,分辨率为 176144。 MPEG4 利用很窄的带宽,通过帧重建技术,压缩和传输数据,以求以最少数据获得最佳图像质量。 MPEG4 更适用于交互 AV 服务以及远程监控。 MPEG7 由 MPEG 委员会于 1998 年 10 月提出提议, 2020 年 9 月正式成为国际标准,又称为 “ 多媒体内容描述接口( Multimedia Content Description Interface) ” ,其目标是建立对多媒体信息内容的标准化描述,试图规范不同种类多媒体信息的描述而不受表达形式的限制。 这些描述要与信息内容直接相关 以便用来快速有效的查询、访问各种多媒体信息。 MPEG7 的应用范围广泛,既可以应用于存储,也可用于流式应用(如广播、将模型加入 Inter 等)。 它可以在实时或非实时环境下应用,如数字图书馆、多媒体编辑等。 另外, MPEG7 在教育、新闻、导游信息、娱乐、研究业务、地理信息系统、医学、购物、建筑等各方面均有较深的应用潜力。 MPEG21是基于 “ 多媒体框架( Multimedia Framework)标准 ” 的,其最终目的是建立一个多媒体框架,以通过预购网络和设备使多媒体资源在用户之间透明方便的使用。 5 MPEG21的基本框架要素包括数字项目说明、内容表示、数字项目的识别和描述、内容管理和使用、知识产权管理和保护、终端和网络、事件报告等。 它支持的功能有:通过网络存储,使用并交互操作多媒体对象;实现多种业务模型,包括对版权和交易的自动管理;对内容进行隐私的尊重等。 目前,这一标准仍处于开发当中。 (二) 1984 年国际电报电话咨询委员会的第 23 研究组建立了一个专家组专门研究电视电话的编码问题。 经过研究与努力, 1988 年形成草案, 1990 年 12 月通过 ITUT 的 [7]建议。 是 ITUT 针对可视电话和会议、窄带 ISDN 等要求实时编码和低延时应用提出的一个编码标准。 它允许 “ 采用 p64kbit 的图像业务的图像编解码 ” ,因而 简称 p64。 其中 p 是一个整数,取值范围为 1~ 30,对应比特率为 64kb/s~。 它建议采用中间格式 CIF( Common Intermediate Format)和 QCIF( Quarter CIF)解决不同制式通信的矛盾;解决了编码算法问题。 采用了运动补偿预测和离散余弦变换相结合的混合编码方案,获得很好的图像压缩效果。 1995 年,在 的基础上, ITUT 总结当时国际上视频图像压缩编码的最新进展,针对低比特率视频应用制定了 标准。 它提高了运动补偿的精度,常用于超低速率的图像传输,被公认为是以像素为基础的采用第一代编码技术的混合编码方案所能达到的最佳结果。 之后, ITUT 又对其进行了补充,以提高编码效率,增强编码功能。 补充修订的版本有 1998 年的 +, 2020 年的 ++。 采用第一代编码技术,在低速率视频传输质量,抗误码能力方面有明显提高,在视频业务传输中得到广泛应用。 与 只能工作在 CIF、 QCIF 两种格式不同, 的信源编码器可以工作于 5 种图像格式: QCIF、 SubQCIF、 CIF、 4CIF、 16CIF。 另外, 还在 基本编码算法的基础上提供了四种可选编码模式:非限制运动矢量模式、基于语法的算术编码模式、高级预测模式以及 PB 帧模式。 由于仅限于五种固定图像大小、形状和时钟频率,它应用的灵活性较低。 +[8]即 ITUT 在 1998 年通过的 第二版,增加了 12 个新的高级模式,修正了第一版中的非限制运动矢量模式。 修订版首先在视频格式多样性上做了改进,还提出一些新技术:如附加增强信息模式和增强参考帧再采样模式,进一步扩大适用范围,支持图像冻结和快照,以及多分辨率视频的应用,同时还增加了一些新技术来增强抗误码的能力:如分片结构模式、增强参考帧选择模式等,使视频信号经过压缩编码后能够在具有较大噪声干扰的窄带信道 PSTN( Integrate Services Digital Network)和无限移动信道等 上传输。 通 6 过使用去方块效应滤波器,降低分辨率更新模式和修正量化模式等新技术,重建图像的主观质量显著提高。 由于 +的高级模式有些不能同时使用,有些需结合使用,如何选择合适的编码模式结合,对使用者来说很困难,因此 ITUT 于 2020 年 11 月提出了 ++,称为 的第三版。 它在 +的基础上增加了三个高级模式。 [9]标准是 ITUT和 ISO/IEC联合制定的最新的图像压缩编码标准,它最先由 ITUT的 VCEG 于 1997 年提出的,它的目标是提出一种更高性能的视频质量有实质性提 高的视频编码标准。 该标准于 2020 年 3 月完成,在 ITUT 中被称为 Remendation H .264 而在ISO/IEC 中成为 MPEG4 标准的第 10 部分( ISO/IEC 1449610 AVC,简称 MPEG410)。 :视频编码层( VCL: Video Coding Layer)以及网络适配层( NAL: Network Adapter Layer),前者负责对视频进行高效的压缩,后者则负责根据网络的传输需要进行编码数据的打包。 以下的特点:低码率、高质量、可达到比 +提高一倍以上的编码效率;广阔的应用范围,既可用于严格时延限制的实时通信,可用于对时延要求不高的其他应用;稳健性,在网络中传输时,有较强的抗误码性能;对各种网络的友好性,提供了友好的网络接口。 第三节 图像压缩技术分类 图像压缩的优点在于,如抗干扰、处理精度高、灵活性好等,其中主要缺点是数据量太大,传输中占频带太宽。 数字图像数据量的压缩按应用不同可分为以下三类: ① 信息保持型数据压缩 ( 无损压缩 ): 它要求压缩图像的比特数而不丢失任何信息。 主要用 在图像信息保存中,要求图像存储能保持信息并能快速存取图像。 例如短时随机存取主要用于处理过程中的各个环节的存储,它要求经过不同存储介质多次重复不变质、不失真。 又如遥感图像,摄取地球上许多地区,因来不及处理,可暂时保存以便以后处理。 ② 保真度型数据压缩 : 传送的图像应该能够适应通信的通道限制,若接收端是人观看的情况,由于人眼的生理特性不需要过高的空间分辨率和灰度分辨率,因此在压缩过程中允许丢失一些人感觉不到的信息,这就是一种允许微量失真的图像压缩。 数字电视、图像传输和多媒体中常用这种压缩。 ③ 特征保持型数据压 缩 ( 有损压缩 ): 许多图像处理的目的是为了计算机的识别、分析、控制,这时并不需要图像的全部细节及灰度细节。 只要能保存图像中的感兴趣的特征 7 信息,无用信息都可丢掉。 例如识别军舰类型、巡航导弹地形识别等只要轮廓信息就可以了。 又如在机场跑道的识别中农田、房屋信息皆可丢掉,只保留跑道的图像信息即可。 这些图像信号可以进行特征保持型数据压缩。 图像编码也可以根据编码所在数据域划分为空间域编码和变换域编码。 第四节 图像压缩技术的发展趋势 从国际数据压缩技术的发展尤其是 MPEG 的发展可以看出,基于内容的图像压缩编码方法是未来编码的发展趋势。 它不仅能满足进一步获得更大的图像数据压缩比的要求,而且能够实现人机对话的功能。 另外,任意形状物体的模型建立的关键问题还没有解决,这严重影响其应用的广泛性。 通过元数据进行编码也是今后编码的发展方向。 元数据是指详细的描述音 /视频信息的基本元素,利用元数据来描述音视频对象的同时也就完成了编码,因为此时编码的对象是图像的一种描述而不再是图像本身。 从另一个角度来说,进一步提高压缩比,提高码流的附属功能(码流内容的可访问性、抗误码能力、可伸缩性等)也将是未来的编码的两个发展方向。 第五节 本章小结 图像压缩技术已经为开拓全新的应用领域打下了坚实的基础。 图像压缩技术的基本应用在更深更广层次上的应用就成为我们研究的热点。 本章重点对现代图像压缩技术进行概括性介绍。 图像压缩就是减少表示数字图像时需要的数据量。 是指以较少的比特有损或无损地表示原来的像素矩阵的技术,也称图像编码。 其次介绍了静态与动态图像的压缩标准。 最后分别介绍了图像压缩技术的分类。 8 第二章 图像有损压缩技术 随着多媒体技术和通讯技术的不断发展 , 多媒体娱乐、信息高速公路等不断对信息数据的存储和传输提出了更高的要求,也给现有的有限带宽以严 峻的考验,特别是具有庞大数据量的数字图像通信 , 更难以传输和存储,极大地制约了图像通信的发展,因此图像压缩技术受到了越来越多的关注。 图像压缩的目的就是把原来较大的图像用尽量少的字节表示和传输 , 并且要求复原图像有较好的质量。 利用图像压缩可以减轻图像存储和传输的负担 , 使图像在网络上实现快速传输和实时处理。 第一节 有损压缩概述 有损压缩 [10]是对利用了人类是绝对图像或声波中的某些频率成分不敏感的特性,允许压缩过程中损失一定的信息;虽然不能完全回复原始数据,但是所损失的部分对理解原始图像的影响缩小有损压缩, 却换来了大得多的压缩比。 有损压缩广泛应用于语音,图像和视频数据的压缩。 常见的声音、图像、视频压缩基本都是有损的。 有损压缩可以减少图像在内存和磁盘中占用的空间,在屏幕上观看图像时,不会发现它对图像的外观产生太大的不利影响。 因为人的眼睛对光线比较敏感,光线对景物的作用比颜色的作用更为重要,这就是有损压缩技术的基本依据。 有损压缩的特点是保持颜色的逐渐变化,删除图像中颜色的突然变化。 生物学中的大量实验证明,人类大脑会利用与附近最接近的颜色来填补所丢失的颜色。 例如,对于蓝色天空背景上的一朵白云,有损压缩的方法就是 删除图像中景物边缘的某些颜色部分。 当在 屏幕上看这幅图时,大脑会利用在景物上看到的颜色填补所丢失的颜色部分。 利用有损压缩技术,某些数据被有意地删除了,而被取消的数据也不再恢复。 无可否认,利用有损压缩技术可以大大地压缩文件的数据,但是会影响图像质量。 如果使用了有损压缩的图像仅在屏幕上显示,可能对图像质量影响不太大,至少对于人类眼睛的识别程度来说区别不大。 可是,如果要把一幅经过有损压缩技术处理的图像用高分辨率打印机打印出来,那么图像质量就会有明显的受损痕迹。 在多媒体应用中,常见的压缩方法 [11]有: PCM( 脉冲编码调制 ) ,预测编码,变换编码, 9 插值和外推法,统计编码,矢量量化和子带编码等,混合编码是近年来广泛采用的方法。 mp divX、 Xvid、 jpeg、 rm、 rmvb、 wma、 wmv 等都是有损压缩。 有损数据压缩方法是经过压缩、解压的数据与原始数据不同但是非常接近的压缩方法。 有损数据压缩又称破坏型压缩,即将次要的信息数据压缩掉,牺牲一些质量来减少数据量,使压缩比提高。 这种方法经常用于因特网尤其是流媒体以及电话领域。 在这篇文章中经常成为编解码。 它是与无损数据压缩对应的压缩方法。 根据各种格式设计的不同,有损数据压 缩都会有 generation loss:压缩与解压文件都会带来渐进的质量下降。 第二节 有损压缩机制 由于图像数据之间存在这一定的冗余,所以使得数据的压缩成为可能。 信息论的创始人 Shannon 提出把数据看作是信息和冗余度 [12]( redundancy)的组合。 所谓冗余度是由于一副图像的各像素之间存在着很大的相关性,可利用一些编码的方法删去它们,从而达到减少冗余压缩数据的目的。 为了去掉数据中的冗余,常常要考虑信号源的统计特性,或建立信号源的统计模型。 图像的冗余包括以下几种: ① 空间冗余:像素点之间的相 关性; ② 时间冗余:活动图像两个连续帧之间的冗余; ③ 信息熵冗余:单位信息量大于其熵; ④ 结构冗余:区域上存在非常强的纹理结构; ⑤ 知识冗余:有固定的结构,如人的头像; ⑥ 视觉冗余:某些图像的失真是人眼不易觉察的。 对数字图像进行有损压缩通常利用两个基本原理: 一是数字图像的相关性。 在图像的同一行相邻像素之间,相邻像素之间,活动图像的相邻帧的对应像素之间往往存在很强的相关性,去除或减少这些相关性,也即去除或减少图像信息中的冗余度也就实现了对数字图像的有损压缩。 帧内像素的相关称 为 空域相关性。 相邻帧间 对应像素之间的相关性称 为 时域相关性。 二是人的视觉心理特征。 人的视觉对于边缘急剧变化不敏感 ( 视觉掩盖效应 ) ,对颜色分辨力弱,利用这些特征可以在相应部分 , 适当降低编码精度而使人从视觉上并不感觉到 10 图像质量的下降,从而达到对数字图像有损压缩的目的。 有损压缩有两种压缩机制 [13]: ① 有损变换编解码 :。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。