基于matlab的jpeg基本系统编码内容摘要:

种函数的用法。 总之, MATLAB 语言已经成为科学计算、系统仿真、信号与图像处理的主流软件。 基于 MATLAB 的 JPEG 基本系统编码 5 MATLAB图像类型 图像类型是指数组数值与像素颜色之间定义的关系。 MATLAB 图像处理工具箱支持五种类型的图像: (1) 二进制图像。 在一幅二进制图像中,每一个像素将取两个离散数值 (0 或 1)中的一个,从本质上说,这两个数值分别代表状态 “开 ”(on)或 “关 ”(off)。 (2) 索引图像。 索引图像是一种把像素值直接作为 RGB 调色板下标的图像。 (3) 灰度图像。 灰度图像是包含灰度级 (亮度 )的图像。 在 MATLAB 中,灰度图像由一个 uint uint16 或一个双精度类型的数组来描述。 (4) 多帧图像。 多帧图像也称为多页图像,是一种包含多幅图像或帧的图像文件。 在MATLAB 内存中,多帧图像是一个四维数组,第四维用来指定帧的序号。 多帧图像主要用于需要对时间或场景上相关图像集合进行操作的场合,例如,磁谐振图像切片或电影帧等。 (5) RGB 图像。 RGB 图像也称为真彩图像,其每一个像素由三个数值来指定红、绿和蓝色分量。 GUI 传统的用户界面是指用户与计算机之间进行交互通信联系的平台。 但在近几年,这种概念发生了巨大的变化,出现了多种形式的人机交互方式,从命令的交互方式转变到以图形界面为主的交互形式。 现在,图形界面已在人机交互方式中占主导地位。 图形用户界面(GUI)是包含图形对象 (如窗口、图标、菜单和文本 )的用户界面。 以某种方式选择或激活这些对象,通常会引起动作或发生变化,最常见的激活方法是用鼠标或其他动作。 MATLAB也提供了在 MATLAB 应用程序中加入 GUI 的功能。 GUI 的目前现状为: (1) 就用户界面的具体形 式而言,过去经历了批处理、联机终端 (命令接口 )、 (文本 )菜单等多通道 —多媒体用户界面和虚拟现实系统。 (2) 就用户界面中信息载体类型而言,经历了以文本为主的字符用户界面 (GUI)、以二维图形为主的用户界面 (GUI)和多媒体用户界面,计算机与用户之间的通信带宽不断提高。 (3) 就计算机输出信息的形式而言,经历了以符号为主的字符命令语言、以视觉感知为主的图形用户界面、兼顾听觉感知的多媒体用户界面和综合运用多种感观 (包括触觉等 )的虚拟现实系统。 (4) 就人机界面中的信息维度而言,经历了一维信息 (主要指文本流 ,如早期电传式终端 )、二维信息 (主要是二维图形技术,利用了色彩、形状、纹理等维度信息 )、三维信息 (主要是三维图形技术,但显示技术仍利用二维平面为主 )和多维信息 (多通道的多维信息 )空间。 不论从何种角度看,人机交互发展的趋势体现了对人的因素的不断重现,使人机交互更接近于大自然的形式,使用户能利用日常的自然技能,不需经过特别的努力和学习,认 XX 大学学士学位论文 6 知负荷降低,工作效率提高。 MATLAB 的用户,在指令窗中打开图形界面后,只要用鼠标进行选择和点击,就可浏览那丰富多彩的内容。 由此可见 , 使用 GUI 给大家带来了许多方便。 基于 MATLAB 的 JPEG 基本系统编码 7 第 3章 变换编码 变换编码是目前应用最广泛的图像压缩编码方法,几乎所有的图像 (除 2 值图像外 )和视频压缩标准均以变换编码为工具。 近年所发展的一些技术,如区域或物体编码方法也以变换编码为基础。 变换编码在压缩比、重构图像质量、适应范围和算法复杂性等方面能获得好的折衷,在实际中得到了广泛应用 [3]。 变换编码的一般形式与意义 信源编码实质是一种变换,变换就是将像素信息重组为更紧凑的形式,并产生一系列表示像素值的数字信号,并能在信道中更有效地传送。 在变换编码 中,用一组代表空间频率分布的变换系数表示一组空间几何位置像素值,通过这种映射能够巧妙地解除或减弱图像信号的相关性 (原始图像的帧与帧、场与场、行与行之间存在很强的相关性 )。 显然,如果变换系数选择得恰当,所得变换系数之间的相关性要明显小于原始像素之间的相关性,从而达到降低冗余度的目的。 再根据人眼对图像高频成分不如对低频成分敏感的特点,对各个变换系数进行符合主观视觉特性的加权处理,而后量化,就可以获得大幅度的数据压缩。 事实上变换编码都能实现信源编码的解相关性即压缩,换言之,变换并非一定要正交变换。 正交变换在硬件技 术中较为容易实现,这是由 (矩阵 )电路对称性决定的。 变换编码不是直接对空间图像信号编码,而是首先将空间域图像信号映射变换到另一个正交矢量空间即变换域,将图像像素转变成一组非相关系数,然后对这些系数进行量化和编码。 可以证明,基于块的变换编码对静止图像和视频帧是一种非常有效的压缩编码方法。 为了充分利用像素之间的空间相关性,理想的变换块尺寸应该是整幅图像或视频帧大小,但其计算量却是十分惊人的。 为减少计算复杂度,在实际应用上一般都采用基于一定尺寸块的变换编码,即把整幅图像分成许多不重叠的块,对每个块进行变换编码。 在 静止图像和视频编码的许多国际标准采样基于 161 8 44 的 DCT 变换编码方法。 变换编码技术上比较成熟,理论也比较完整,广泛应用到各种静止图像数据压缩,以及运动图像的帧内压缩,帧间预测误差信号的压缩编码。 正交变换的种类很多,如傅里叶变换 (Fourier Transform)、离散余弦变换 (DCT)、沃尔什变换 (Walsh Transform)、哈尔变换(Haar Transform)、斜变换 (Slant Transform)、离散正弦变换 (DST)、 KL 变换 (Karhunen Transform)、小波变换 (Wavelet Transform)等。 基本原理 变换编码的通用模型如图 所示。 其中映射变换是把原始信号中的各个样值从一个域变换到另一个域,然后针对变换后的数据再进行量化 (二次量化 )与编码操作。 接收端首先对接收到的进行解码和反量化 (Dequantization),然后再进行反变换以恢复原来信号 (在一 XX 大学学士学位论文 8 定的保真度下 )。 映射变换的关键在于能产生一系列更有效的系数,对这些系数进行编码所需的总比特数,要比对原始数据进行编码所需的总比特数少得多,使数据率得以降低。 映 射 变 换 量 化 编 码反 量 化反 映 射 变 换 解 码信 道原 始 数 据恢 复 数 据 图 变换编码的通用模型 正交变换的去相关性 映射变换的方法很多,一般是指函数变换法,而常用的又是正交变换法。 比如,我们所熟知的傅里叶变换就是利用复数域正交变换,将一个函数从时域描写变为频域的频谱展开。 这样有可能使函数的某些特性变得明显,使问题的处理得到简化。 现在用最简单的连续信号 )2sin()( ftAty  为例来说明图像经过正交变换如何能够去除空间相关性达到压缩图像数据量。 当变量 t 从 ∞到 ∞变换是, f(t)的取值有无穷多个,即使按照奈奎斯特 采样定理进行采样,要描述该信号也需要限制采样间距保证有足够的采样点。 如果将其变换到频域表示,只需要用一个幅值参数 A 和一个频率参数 f 值就能完全描述信号了,可见在时域上采样值之间存在非常强的相关性,数据冗余度大。 而变换域上的两个参数,相互独立,没有相关性,描述信号的数据量大大减少。 对于图像信号也是如此,图像信号转换到变换域后,其相关性下降,数据冗余度减小,压缩数据有显著效果。 从一个简单的图像实例来说明正交变换的去相关性。 假设把一个 nn像素的图像子块看成为 2n 维坐标空间 上的一个坐标点,也就是说,在这个坐标空间上的不同坐标点对应于不同灰度分布的 2n 维图像子块 (不同图像子块其区别在于不同的灰度分布,相同之处是其尺寸都是 nn)。 而这个坐标空间的每一个坐标轴上坐标值对应的是图像子块像素所有可能的灰度级。 以 12 像素构成的子图像 (即相邻两个像素组成的子图像 )为例,设每个像素取8 个灰度级 (3bit 量化 )。 则图 (a)中二维坐标的 1x 轴表示第一个像素可能取的 8 个灰度级,2x 轴表示第二个像素可能取的 8 个灰度级。 由 1x 、 2x 组成的二维坐标空间中不同坐标点对应于不同的 12 子图像,该点数值由两个像素的灰度所组成。 所有两个像素点 ( 1x , 2x )图像子块的灰度分布为 )77()71()11()01()70()10()00( ,,,,,,,,  ,共有 64 种不同灰度分布的图像子块,用图 (a)中的 64 个坐标点表示。 对于一般图像而言,因相邻像素之间存在 很强的相关性,绝大多数的子图像中相邻两像素其灰度级相等或很接近,也就是说在直线 1x = 2x 附近出现的概率大。 或者说,绝大多数图像子块落在图 (a)中的弧度内。 现在将坐标系逆时针转 45 ,如图 (b)所示。 在新的坐标系 1y 、 2y 中,即绝大多数图像子块落在 1y 轴附近,在 这些区域上的图像子块,其 1y 与 2y 相差较大。 由此表明变量 1y 、2y 之间的联系比变量 1x 、 2x 之间的联系,在统计上更加独立,而且方差也重新分布。 在原来坐标系中,图像子块的两个像素具有较大的相关性,能量的分布比较分散,两者具有大致相同的方差 2221 xx  ;而在变换后的坐标系中,图像子块的两个像素之间的相关性大大基于 MATLAB 的 JPEG 基本系统编码 9 减弱,能量的分布向 1y 轴集中,其 1y 的方差也远大于 2y ,即 2221 xx  。 从这个简单的例子可以看出,这种变换后坐标轴上方差不均匀分布正是正交变换编码能够实现图像数据压缩的理论根据。 若按照人的视觉特性,只保留方差较大的那些变换系数分量,就可以获得更大的数据压缩比,这就是所谓视觉心理编码的方法之一。 将上述简单的实例推广到一般的 nn 维图像的变换,图像在 2n 维变换域中,相关性大大下降。 因此用变换后的系数进行编码,将比直接使用原图像数据编码获得更大的数据压缩 [4]。 0 1 2 3 4 5 6 72134567( a ) 变 换 前1x2x0 1 2 3 4 5 6 72134567( b ) 变 换 后1x2x 1y2y 图 正交变换的物理概念 综上所述,图像正交变换实现数据压缩的物理本质在于:把在原来坐标轴上彼此密切相关的像素所构成的矩阵经过多维坐标轴适当的坐标轴旋转和变换,变成统计上彼此较为相互独立、甚至达到完全 独立的变换系数所构成的矩阵。 或者说把接近均匀散布在各个坐标轴上的原始图像数据,变换在新的坐标系中,图像数据只集中在少数坐标上,实现高效率的压缩编码。 变换编码性能判断 从上面的例子看成,图像正交变换可以看成是选用新坐标系的过程。 如将新坐标系用一组基矢量或变换基函数来表示,那么正交变换过程便可描述为图像如何用一组所选定的基矢量进行线性组合的过程。 每个基矢量对图像的贡献就是相应基矢量的变换系数。 求出图像块在给定一组基矢量的变换系数的过程称为正变换,从变换系数恢复重建图像块的过程称为反变换。 设一维离 散信号有 N 个采样点组成,在变换前用矢量 TNxxxX )( 21 ,,  来表示,其变换后的系数采用矢量 TNyyyY )( 21 ,,  来表示,用 V 表示正交变换核矩阵,由变换基矢量 Nvvv ,, 21 构成,即 )( 21 NvvvV ,,  ,则离散信号的正交变换式可以写成 VXY () 当图像变换核矩阵是酉 矩阵,或者说上式的正交变换基矢量满足正交归一化时,变换核矩阵存在逆矩阵 1V ,而且 TVV 1 , TV 是变换核矩阵的转置矩阵,此时根据变换后系 XX 大学学士学位论文 10 数利用反变换重建原来图像: YVYVX T 1 () 变换核矩阵满足: IVVVV TT  () I 表示 NN 的单位矩阵。 对于变换编码,除了对输入信号如何变换以及如何从变换系数反变换恢复图像之外,我们还关心变换前原始信号和变换后系数的统计特性,以便进一步明确变换编码性能。 变换编码的性能依赖于所选定的基矢量,采用不同的就矢量,变换编码的去相关性能、计算复杂度、变换系数值以及变换系数分布也不相同。 因此,一个正交变换应该关心以下几个主要内容: (1) 去相关性。 去相关性越强,变换之后的系数越独立,冗余数据越少。 (2) 变 换后数据的分布性。 一个好的变换编码应该使图像能量尽可能地集中在少数几个位置上,也就是用幅值较大的很少几个系数便可以描述原来图像块。 (3) 计算复杂度。 所选用的基矢量简单,能够很方便地求出变换后系数,同时也能很容易、无失真地从变换系数反变换得到原来图像值。 信息论的研究表明,图像正交变换不改变信源的熵值,变换前后图像的信息量并无损失,完全可以通过反变换得到原来的图像值。 但是在实际上,不是直接对变换的系数。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。