基于小波变换的图像压缩系统的实现毕业设计论文(编辑修改稿)内容摘要:

现了以下的视觉均匀特性: ①视觉系统对图像的亮度和色度的敏感性相差 很大,视觉系统对亮度的敏感度远远高于对色彩度的敏感度。 ② 随着亮度的增加,视觉系统对量化误差的敏感性降低。 这是由于人眼的辨别能力与物体周围的背景亮度成反比。 因此,在高亮度区,灰度值的量化可以更粗糙一些。 湖南工业大学本科毕业设计(论文) 6 图像压缩编码的技术指标 一般地,图像压缩应能做到压缩比大、算法简单、易于硬件和软件实现、压缩和解压实时性好、解压缩恢复的图像失真小等。 但这些指标对同一压缩方法很难统一,在实际系统中往往需要抓住主要矛盾,全面权衡。 下面介绍常用的图像压缩技术指标。 1.图像熵与平均码长 熵是指信源的平均信息量。 如 果一幅图像像素的灰度级为 ix (I=1,2… M), 若 ix 出现的概率为 P( ix ),则图像的熵定义为:21( ) ( ) lo g ( )miiiH x p x p x  图像熵表示像素灰度级集合的平均比特数。 熵的单位为比特/字符。 熵具有以下的性质: (1)当 M 级灰度出现的概率相等时,即 P( ix )=1/ M 时,有最大熵值 H(x)= M2log ; (2)在极端情况下,当 0)( ixP 或 1)( ixp 时, 0)( xH ,这表明确定性信号的熵值为0; (3)随机性图像信号的熵非负,满足。 lo g)(0 2 MxH  (4)令 M=2i 则在各灰度等概率的情况下, iixp 2)( , LxH )(。 在不等概率的情况下,H(x)L 平均 码字长度简称平均码长,是码字长度的数学期望,即 LxPxR Mi i 1 )()( () 显然 R(x)的单位也是比特/字符。 根据 Shannon信息保持编码定理,要保持信源的全部信息就必须有 )()( xHxR  () 否则一定会产生信源的编译码 失真。 2.图像冗余度与编码效率 从上面的分析可以看出,图像无损压缩码长以 H(x)作为极限。 因此可以定义冗 余度 r, R=1)( )(xRxH () 将编码效率  湖南工业大学本科毕业设计(论文) 7 )( )(xR xH () 可见,当平均码长接近 H(x)时,冗余度下降至 0,编码效率提高至 l。 这正是编码追求的目标。 3.压缩比 压缩比 e是衡量数据压缩方法压缩程度的一个指标,反映了压缩效率。 通常将 C,定义为压缩前图像每像素的码长与压缩后每像素码长的平均码长之比。 4.主观质量评价 除了机器视觉,许多图像是为人类服务的,信宿实际上是人的眼睛,当然最终的评价标准是人的主观感觉。 主观评价结果可以用参与测试组全体组员的平均判分来统一衡量。 图像的主、客观两种评价之间存在着密切的联系。 但一般来说,客观评价高的主观评价 也高,因此在图像的质量评价时,首先做客观评价,以主观评价为参考。 5. 感兴趣区质量评价 【 12】 图像最终是供人看的,因此合理地评价图像质量的方法应充分遵循人眼视觉特性。 人们已经发现,人眼视觉具有一定的选择性。 人们在观察和理解图像时会不自觉地对其中某些区域产生兴趣。 对于一幅人的图像,人们通常注意人的脸区。 但对于一幅头肩图像,发型设计师除注意人脸区之外,可能更关注该人的发型。 为讨论问题的简化起见,我们假设分析图像中只有一个感兴趣区 A1,其面积为 S1,不感兴趣区 A2的面积为 S2,图像的总面积 21 SSS 。 视觉经验告诉我们,对于给定的一幅图像,人眼对其不同区域感兴趣的程度是不同的。 如头肩图像,人眼往往对入脸区 (感兴趣区 )的失真敏感,而对其余部位 (不感兴趣区 ),则能允许存在较大的失真 【 13】。 对于感兴趣区,当其面积越来越小时,人眼对其失真就越来越敏感,也就是说,人眼对它的感兴趣程度大体上与其面积成反比。 当感兴趣区扩张至整幅图像时,人眼对它的感兴趣将隆到最低,如同不感兴趣区。 对于不感兴趣区,感兴趣区对其兴趣程度有屏蔽作用。 当感兴趣区的面积较大时,随着感兴趣区面积的增大,人眼对不感 兴趣区的兴趣将逐渐增强,而当感兴趣区域的面积较小时,随着感兴趣区面积的减小,尽管人眼对感兴趣区的兴趣越来越强,但由于不感兴趣区的不断扩大,使得观察者越来越不能忽视它的存在,也就是说人眼对不感兴趣的兴趣程度也越来越强。 在感兴趣区的面积等于零或者感兴趣区扩张至整幅图像的两种情况下,被测图像湖南工业大学本科毕业设计(论文) 8 的失真对人眼视觉的影响可以近似认为等价的。 将上述视觉经验加以定量化,便可以实现对视觉兴趣性的定量测量。 数据压缩方法 数据压缩的方法很多,而且人们还在不断在研究新的方法。 一般数据压缩按信息损失的程度来分类。 常见的 有 20多种常用数据压缩方法。 且这些方法在图像压缩中均有应用。 在无损压缩 (Lossless Compression)中, Huffman编码和 Shannon编码根据概率分布特性确定码长;游程编码根据连续灰度的游程来确定编码;算术编码随信源数据不断缩小的实数区间,然后用一个与实数对应的二进制码代表被编码的信息;轮廓编码根据相同灰度的区域边界线编码。 在有损压缩 (Lossy Compression)中,预测编码根据相邻像素相关性来确定后继像素的预测值,若用差值进行编码则可以压缩数据量;变换编码对原始图像进行正交变换,在变换域进行抽样达到压缩的目的;混合编码将两种编码方法结合起来,如将预测编码与变换编码相结合,以取得更好的效果。 在现代压缩编码方法中,分形编码利用宏观与微观的相似性来压缩数据量,可以获得极大的压缩比。 该方法压缩过程中的计算量很大,但解压缩很快,适用于图像数据的存储和重现。 模型基 (modelbased)编码也是一种新型压缩方法。 该方法在发送端利用已知且变化慢的场景得到数据量不大的模型参数,在接收端利用综合模型参数恢复原始图像。 1.统计编码 利用信源的统计特性进行码率压缩的编码方式称为熵编码,也叫统 计编码。 常用的统计编码有两种:变长编码 (也称为哈夫曼编码 )及算术编码。 (1)Huffman编码 1952年,哈夫曼提出变长编码方法:对出现概率大的符号分配短字长的二进制码,对出现概率小的符号分配长的二进制码,得到符号平均码长是最短的码。 变长编码也称为最佳码方法。 哈夫曼编码的实施步骤如下: 第一步,将信息符号按其出现概率从大到小排列; 第二步,将两个最小概率组成一组,划成 2个分支域,并标以 0和 l;再把 2个分支域合并成 1个分支域,标以两个概率之和: 第三步,找出概率和 1. 0到各信息符号的路径,记下各路径从右 到左各分支域的 0湖南工业大学本科毕业设计(论文) 9 和 1,即得到信息符号相应的码字。 理论上,这种编码方法是最佳的。 实际上,利用硬件实现时,出现概率的 值不可能精确到小数后多少位,而最小存储单元为 lbit,会引起概率匹配不准确及编码效率的下降。 (2)算术编码 算术编码和哈夫曼编码不同,不采用一个码字代表一个输入信息符号的办法,而采用一个浮点数来代替一串输入符号。 经算术编码后输出一个小于 l,大于或等于 0的浮点数,在解码端再进行正确、惟一地解码,恢复原符号序列。 2.预测编码 预测编码也称为差值脉冲编码调制 (DPCM)。 在预测编码中所采用的主要是 两大技术:信号的最佳线性预测和最佳量化。 由图像的统计特性分析可知,图像相邻像素之间存在很强的相关性,因此可以用已知的前面几个像素的值进行预测。 而把实际的值与预测的差作为传输的对象。 当对预测的误差不进行量化时,即在不产生量化误差的条件下,也可用于无失真编码,获得更高的压缩比。 此外,还可以根据图像的内容采用不同的预测系数,减少预测误差,降低码率,即所谓的自适应预测。 或者利用人眼对差值大小所表现的不同的灵敏度,采用自适应量化技术。 3.变换编码 变换编码不是直接对空域图像信号编码,而是首先将空域图像信号映射到另一 个空间 (变换域 ),产生一组变换系数,然后对这些系数进行量化、编码、传输。 变换编码对静止和运动图像都适用。 常见的变换有离散傅里叶变换 【 1】 (DFT)K. L变换 ‘ 【 2】【 3】 、离散余弦变换 【 4】 (DCT)等。 4.子带编码 子带编码 【】 最初是用于语音编码,其基本思想是发信端利用数字线性滤波器将信号分离为高频和低频两个不同频带的信号,利用与各频率的统计特性相适配的编码进行编码,在接收端,经解码、内插、线性合成滤波器得到信号的恢复值。 子带编码具有子带内编码的噪声只限于子带内,而不会扩散到其他子带的特点,而且可以根据 主观视觉特性,将有限的比特率在各个子带内做合理的分配,即实行噪声频谱成形技术,有利于提高图像的质量。 这些特点对实现所谓的多分辨率图像压缩编码很有利。 5.量化编码 量化编码又分为标量量化和矢量量化 【 5】。 对于经过映射变换后的数据, 或者直接对 PCM数据,一个数一个数的进行量化叫标量量化 (SQ. ScalarQuantization):若对这些数据分组,每组若干个数据作为一个矢量,然后以矢量为单位,逐个量化,称为矢湖南工业大学本科毕业设计(论文) 10 量量化 (VQ: Vector Quantization)。 矢量量化是近年来图像、语音编码技术中颇为流行 的一种新型量化编码方法,其关键问题在于设计一个优良的码本。 6.块截断编码 (BTC: Block Truncation Coding) BTC编码 【 6】【 7】 是一种低复杂度图像编码方法。 它首先将图像分解成大小固定的互不重叠的块,然后对不同的二值量化器进行量化。 量化器的阈值与两个量化重建值由块的局部统计特性决定。 BTC具有编码速度块,算法简单的特点,但一般压缩比不高,且有块效应。 7.分形编码 分形的最显著的特点是自相似性,即:任何尺度不论怎样变化,景物任何一小部分的形状都与整体的形状及其相似。 最早将分形用于图 像编码的比较有效方法是 1984年 Bamsley提出的迭代函数系统 (Interated Function System,简称 IFS)。 它把一幅图像分解为若干类景物的子图像,对每一类子图像找出相应的 IFS码,使这组 IFS码所综合的分形图像在主观质量上与原始子图像非常相似,所获得的压缩效果相当可观。 但这种方法中的 IFS码是交互或半自动的方式获得的,并且编码过程非常耗时。 1989年Bamsley的学生 Jacquin提出了全自动的分形编码方法。 该方法改变先前的全局映射变换为基于局部映射变换。 然而,从目前公开的各种分 形算法来看,它们在不同程度上都有很大的局限性,分形图像编码的真正特点及优势并没有完全体现出来。 8.模型基图像编码 模型基图像编码 【 23】【 24】 是一种基于景物三维模型的方法,编码端与解码端具有相同的景物三维模型。 基于这个模型,在编码器中用图像分析算法提取景物的参数,例如形状参数、运动参数等。 景物的这些参数被编码后通过信道传输到解码端,由后者的解码器根据接收到的参数用图像合成技术再重建图像。 这类图像编码技术与传统的技术不同,它充分利用了图像中景物的内容知识,因而可以实现非常高的压缩比。 模型基图像编码方案一般 可以分为语义基和物体 基图像编码两类。 语义基图像编码充分利用已知景物的知识,可以获得非常高的压缩比。 物体基图像编码方法灵活,应用范围较广。 9.神经网络图像编码 神经网络用于图像编码的研究是试图初步模仿人的视觉系统中某些局部初级功能,并将其研究成果应用到图像编码领域。 目前,直接数据压缩中使用的神经网络结构有两类:反向误差传播 (Back Propagation)型神经网络和自组织映射 (SelfOrganization Map)神经网络。 除了把神经网络直接应用于图像数据压缩之外,还可以把神经网络同湖南工业大学本科毕业设计(论文) 11 传统的图像编码算 法结合,构成许多直接应用神经网络的图像编码算法。 10.小波变换 (DWT)编码 【 8】 基于 DWT的编码方法在九十年代受到了广泛的研究。 它是将图像先进行小波变换,然后利用 DWT具有的很多良好性质,如:空间和频域局部性、方向性、多分辨率性等,来研究如何组织的量化变换系数的编码方法。 第 3 章小波分析理论 小波理论的发展 小波分析的思想可以追溯到 1910 年 Haar 提出的小波标准正交基,但小波分析这一概念是 1984 年由法国地质学家 Morlet 在分析地震信号时提出来的。 当时, Morlet发现,短时傅里叶变换在时、 频分辨力方面的矛盾使得固定时宽的加窗方法并非对所有非平稳信号都合适。 也就是说,窗宽应该依据非平稳信号的变化自动调节,形成所谓的小波。 真正的小波分析研究始于 1985 年,当时法国的数学家 Meyer 构造的函数系 (Meyer基 )对小波分析起到奠基作用。 后来 1988 年法国信号处理。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。