基于小波变换的图像压缩系统的实现本科毕业设计论文(编辑修改稿)内容摘要:
分 别 表 示 原始 图 像和 恢 复图 像 (i,j) 位置 处 的像 素 值,1 iM ,1 jN ,PSNR本质上与 MSE相同,其表达式为: 225510 lgPSNR MSE ( ) 式( )和( )看起来 来直观、严格,但用它们所求得的结果常与人们的主观视觉效果不一致。 这 是因为均方误差和峰值信噪比是从总体上反映原始图像和恢复图像的差别,并不能反映一幅图像中少数像素点有较大灰度差别和较多像素点有较小灰度差别等各种情况。 显然,客观质量评价采用式 (2. 6)与式 (2. 7)对图像中所有像素点同样对待,不能全面反映人眼的视觉特性。 客观评价 SNR(信噪比 )指压缩前的图像信号方差 2x 与解压缩后重建误差方差 2e 的比值。 定义如下: 2210 log xeSNR ( ) SNR越大,在压缩过程中引入的失真越小,图像质量越好。 湖南工业大学本科毕业设计(论文) 7 除了机器视觉,许多图像是为人类服务的,信宿实际上是人的眼睛,当然最终的评价标准是人的主观感觉。 主观评价结果可以用参与测试组全体组员的平均判分来统一衡量。 图像的主、客观两种评价之间存在着密切的联系。 但一般来说,客观评价高的主观评价也高,因此在图像的质量评价时,首先做客观评价,以主观评价为参考。 [1] 图像最终是供人看的,因此合理地评价图像质量的方法应充分遵循人眼视觉特性。 人们已经发现,人眼视觉具有一定的选择性。 人们在观察和理解图像时会不自觉地对其中某些区域产生兴趣。 对于一幅人的图像,人们通常注意人的脸区。 但对于一幅头肩图像,发型设计师除注意人脸区之外,可能更关注该人的发型。 为讨论问题的简化起见,我们假设分析图像中只有一个感兴趣区 A1,其面积为 S1,不感兴趣区 A2的面积为 S2,图像的总面积 21 SSS 。 视觉经验告诉我们,对 于给定的一幅图像,人眼对其不同区域感兴趣的程度是不同的。 如头肩图像,人眼往往对人脸区 (感兴趣区 )的失真敏感,而对其余部位 (不感兴趣区 ),则能允许存在较大的失真 [2]。 对于感兴趣区,当其面积越来越小时,人眼对其失真就越来越敏感,也就是说,人眼对它的感兴趣程度大体上与其面积成反比。 当感兴趣区扩张至整幅图像时,人眼对它的感兴趣将降到最低,如同不感兴趣区。 对于不感兴趣区,感兴趣区对其兴趣程度有屏蔽作用。 当感兴趣区的面积较大时,随着感兴趣区面积的增大,人眼对不感兴趣区的兴趣将逐渐增强,而当感兴趣区域的面积较小时, 随着感兴趣区面积的减小,尽管人眼对感兴趣区的兴趣越来越强,但由于不感兴趣区的不断扩大,使得观察者越来越不能忽视它的存在,也就是说人眼对不感兴趣的兴趣程度也越来越强。 在感兴趣区的面积等于零或者感兴趣区扩张至整幅图像的两种情况下,被测图像的失真对人眼视觉的影响可以近似认为等价的。 将上述视觉经验加以定量化,便可以实现对视觉兴趣性的定量测量。 数据压缩方法 数据压缩的方法很多,而且人们还在不断在研究新的方法。 一般数据压缩按信息损失的程度来分类。 常见的有 20多种常用数据压缩方法。 且这些方法在图像压缩中 均有应用。 在无损压缩 (Lossless Compression)中, Huffman编码和 Shannon编码根据概率分湖南工业大学本科毕业设计(论文) 8 布特性确定码长;游程编码根据连续灰度的游程来确定编码;算术编码随信源数据不断缩小的实数区间,然后用一个与实数对应的二进制码代表被编码的信息;轮廓编码根据相同灰度的区域边界线编码。 在有损压缩 (Lossy Compression)中,预测编码根据相邻像素相关性来确定后继像素的预测值,若用差值进行编码则可以压缩数据量;变换编码对原始图像进行正交变换,在变换域进行抽样达到压缩的目的;混合编码将两种 编码方法结合起来,如将预测编码与变换编码相结合,以取得更好的效果。 在现代压缩编码方法中,分形编码利用宏观与微观的相似性来压缩数据量,可以获得极大的压缩比。 该方法压缩过程中的计算量很大,但解压缩很快,适用于图像数据的存储和重现。 模型基 (modelbased)编码也是一种新型压缩方法。 该方法在发送端利用已知且变化慢的场景得到数据量不大的模型参数,在接收端利用综合模型参数恢复原始图像。 1.统计编码 利用信源的统计特性进行码率压缩的编码方式称为熵编码,也叫统计编码。 常用的统计编码有两种:变长编码 (也称为哈夫 曼编码 )及算术编码。 (1)Huffman编码 1952年,哈夫曼提出变长编码方法:对出现概率大的符号分配短字长的二进制码,对出现概率小的符号分配长的二进制码,得到符号平均码长是最短的码。 变长编码也称为最佳码方法。 哈夫曼编码的实施步骤如下: 第一步,将信息符号按其出现概率从大到小排列; 第二步,将两个最小概率组成一组,划成 2个分支域,并标以 0和 l;再把 2个分支域合并成 1个分支域,标以两个概率之和: 第三步,找出概率和 ,记下各路径从右到左各分支域的 0和 1,即得到信息符号相应的码字。 理论上,这种编码方法是最佳的。 实际上,利用硬件实现时,出现概率的 值不可能精确到小数后多少位,而最小存储单元为 lbit,会引起概率匹配不准确及编码效率的下降。 (2)算术编码 算术编码和哈夫曼编码不同,不采用一个码字代表一个输入信息符号的办法,而采用一个浮点数来代替一串输入符号。 经算术编码后输出一个小于 l,大于或等于 0的浮点数,在解码端再进行正确、惟一地解码,恢复原符号序列。 湖南工业大学本科毕业设计(论文) 9 2.预测编码 预测编码也称为差值脉冲编码调制 (DPCM)。 在预测编码中所采用的主要是两大技术:信号的最佳线性预测和最佳量化。 由图像的统 计特性分析可知,图像相邻像素之间存在很强的相关性,因此可以用已知的前面几个像素的值进行预测。 而把实际的值与预测的差作为传输的对象。 当对预测的误差不进行量化时,即在不产生量化误差的条件下,也可用于无失真编码,获得更高的压缩比。 此外,还可以根据图像的内容采用不同的预测系数,减少预测误差,降低码率,即所谓的自适应预测。 或者利用人眼对差值大小所表现的不同的灵敏度,采用自适应量化技术。 3.变换编码 变换编码不是直接对空域图像信号编码,而是首先将空域图像信号映射到另一个空间 (变换域 ),产生一组变换系数,然后对这些系数 进行量化、编码、传输。 变换编码对静止和运动图像都适用。 常见的变换有离散傅里叶变 [3](DFT)K. L变换 [4][5]、离散余弦变换 [6](DCT)等。 4.子带编码 子带编码 [7]最初是用于语音编码,其基本思想是发信端利用数字线性滤波器将信号分离为高频和低频两个不同频带的信号,利用与各频率的统计特性相适配的编码进行编码,在接收端,经解码、内插、线性合成滤波器得到信号的恢复值。 子带编码具有子带内编码的噪声只限于子带内,而不会扩散到其他子带的特点,而且可以根据主观视觉特性,将有限的比特率在各个子带内做合理的分配 ,即实行噪声频谱成形技术,有利于提高图像的质量。 这些特点对实现所谓的多分辨率图像压缩编码很有利。 5.量化编码 量化编码又分为标量量化和矢量量化 [8]。 对于经过映射变换后的数据, 或者直接对 PCM数据,一个数一个数的进行量化叫标量量化 (SQ. Scalar Quantization):若对这些数据分组,每组若干个数据作为一个矢量,然后以矢量为单位,逐个量化,称为矢量量化 (VQ: Vector Quantization)。 矢量量化是近年来图像、语音编码技术中颇为流行的一种新型量化编码方法,其关键问题在于设计一个优良 的码本。 6.块截断编码 (BTC: Block Truncation Coding) BTC编码 [9][10]是一种低复杂度图像编码方法。 它首先将图像分解成大小固定的互不重叠的块,然后对不同的二值量化器进行量化。 量化器的阈值与两个量化重建值由块的局部统计特性决定。 BTC具有编码速度块,算法简单的特点,但一般压缩比不高,且有块效应。 7.分形编码 湖南工业大学本科毕业设计(论文) 10 分形的最显著的特点是自相似性,即:任何尺度不论怎样变化,景物任何一小部分的形状都与整体的形状及其相似。 最早将分形用于图像编码的比较有效方法是 1984年 Bamsley提 出的迭代函数系统 (Interated Function System,简称 IFS)。 它把一幅图像分解为若干类景物的子图像,对每一类子图像找出相应的 IFS码,使这组 IFS码所综合的分形图像在主观质量上与原始子图像非常相似,所获得的压缩效果相当可观。 但这种方法中的 IFS码是交互或半自动的方式获得的,并且编码过程非常耗时。 1989年Bamsley的学生 Jacquin提出了全自动的分形编码方法。 该方法改变先前的全局映射变换为基于局部映射变换。 然而,从目前公开的各种分形算法来看,它们在不同程度上都有很大的局限性,分 形图像编码的真正特点及优势并没有完全体现出来。 8.模型基图像编码 模型基图像编码 [11][12]是一种基于景物三维模型的方法,编码端与解码端具有相同的景物三维模型。 基于这个模型,在编码器中用图像分析算法提取景物的参数,例如形状参数、运动参数等。 景物的这些参数被编码后通过信道传输到解码端,由后者的解码器根据接收到的参数用图像合成技术再重建图像。 这类图像编码技术与传统的技术不同,它充分利用了图像中景物的内容知识,因而可以实现非常高的压缩比。 模型基图像编码方案一般可以分为语义基和物体基图像编码两类。 语义基图像编 码充分利用已知景物的知识,可以获得非常高的压缩比。 物体基图像编码方法灵活,应用范围较广。 9.神经网络图像编码 神经网络用于图像编码的研究是试图初步模仿人的视觉系统中某些局部初级功能,并将其研究成果应用到图像编码领域。 目前,直接数据压缩中使用的神经网络结构 有 两 类 : 反 向 误 差 传 播 (Back Propagation) 型 神 经 网 络 和 自 组 织 映 射(SelfOrganization Map)神经网络。 除了把神经网络直接应用于图像数据压缩之外,还可以把神经网络同传统的图像编码算法结合,构成许多直接应用神经网络的图像编码算法。 10. 小波变换 (DWT)编码 [13] 基于 DWT的编码方法在九十年代受到了广泛的研究。 它是将图像先进行小波变换,然后利用 DWT具有的很多良好性质,如:空间和频域局部性、方向性、多分辨率性等,来研究如何组织的量化变换系数的编码方法。 湖南工业大学本科毕业设计(论文) 11 静态图像压缩编码标准 JPEG ISO(International Standardization Organization)于 1986年成立了联合图片专家组 (Joint Photographic Experts Group, JPEG),并于 1994年 2月 15日正式出版了第一个用于静态图像压缩的压缩编码国际标准 ISO/ IEC 10918。 JPEG标准针对自然景物的静止图像进行压缩编码,用于数字图像的存储与传输,应用范围很广。 JPEG标准定义了两种基本的压缩算法,一种是基于 DCT的有失真的压缩算法,另一种是基于空间线性预测技术 (DPCM)的无失真压缩算法。 对 DCT系数量化时,考虑视觉特性采用了加权的量化矩阵,对量化的系数采用 Z形扫描方式。 在编码过程中采用 Huffman编码和算术编码进行熵编码。 JPEG 20xx JPEG 20xx是新的图像压缩标 准,其目标是在一个统一的集成系统中,允许使用不同的图像模型 (如客户/服务器、实时传输、图像库驱动、有限缓冲和带宽资源等 ),对具有不同特征 (如自然图像、计算机图像、医疗图像、遥感图像以及复合文本等 )的不同类型 (如二值、灰度、彩色或者多分量图像 )的静止图像进行压缩,在低比特率的情况下,获得比目前标准更好的率失真性能和主观图像质量。 1. JPEG 20xx的主要特点: (1)良好的低比特压缩性能 这是 JPEG 20xx最主要的特征。 目前的 JPEG标准,对于细节分量多的灰度图像,当码率低于 ,视觉失真 大。 为克服这一点,要求 JPEG 20xx在低比特率下有良好的率失真性能,以适应网络、移动通信等有限带宽的应用需要。 (2)连续色调和二值图像压缩 目前的 JPEG标准对于自然图像具有良好的压缩性能,但是当用于计算机图形和二值文本的压缩时,性能变差,不适用于复合文本压缩。 为了改进这一点, JPEG 20xx在同一系统中采用相似的方法,能够对自然图像、复合文本、医学图像、计算机图像等具有不同特征、不同类型的图像进行压缩。 (3)有损和无损压缩 对于目前的 JPEG标准,在同一压缩码流中不能同时提供有损和无损两种压缩, 而湖南工业大学本科毕业设计(论文) 12 在 JPEG 20xx系统中,通过选择参数,能够对图像进行有损和无损两种压缩,可满足图像质量要求很高的医学图像、图像库等方面的处理需要。 (4)按照像素精度或者分辨率进行累进式传输 累进式图像传输允许图像按照所需的分辨率或像素精度进。基于小波变换的图像压缩系统的实现本科毕业设计论文(编辑修改稿)
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。
用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。