毕业论文视频压缩编码技术设计

毕业论文视频压缩编码技术设计内容摘要：

inance 块有两类帧内预测方式，按标准中的记号表示为 :Intra _16x 16 和 Intra_4x4，而两个 chrominance 分量则采用相同的预测方式。 Intra _16x 16 是对整个 16x16 大小的 luminance 进行预 6 测，一般用于图像比较平坦的区域，共有 4 种预测方式 .而 Intra 4x4 方式是将 16x16大小的 luminance 划分为 16 个 4x4 大小的亮度块，然后对每个 4x4 大小的块进行预测，共有 9 种预测方式。对于 chrominance 分量 (Cr和 Cb)，预测是对整个 8x8 块进行的，共 4 种预测方式。的帧内编码框图如图所示：图帧内编码框图 16 x16 帧内预测 16 x 1 6 预测方式是基于在 16x16 块的基础上，用于对图像中的相对不变的部分进行编码。 16x16 帧内预测模式根据与当前宏块邻近的 33 个像素来生成luminance 分量的预测数据，共有 4 种预测方式，如图，垂直（ vertical）、水平（ horizontal） , DC 和平面（ plane）。在进行预测之前，首先要判断这些邻近像素是否可用 (available)，如果这些像素不可用，例如邻近像素所在的宏块位于其它Slice 之中或当前宏块位于图像边缘时某些预测模式就用不起来。宏块帧内预测熵编码反变换反量化熵编码量化变换 Mean(H+V) 7 图 16 x16 帧内预测 4x4 帧内预测模式在此模式下，编码器将当前宏块 16x16 的 luminance 分量划分为 16 个 4x4 的块，然后根据每个 4x4 块周围的邻近像素对该块做预测。按理说，对一块像素做预测，其上下左右的像素都应当作为参考，但由于编码顺序的原因，只选择了 13 个像素作为参考。同 Intra_16x16 模式一样，在开始预测之前，首先需判断 AM 这些参考像素是否可用，如果有些参考像素不可用，那么有些预测模式也就不能用了。编码器端用于预测的参考数据是经过反变换与反量化后的重建图像，所以判断的主要依据就是看这些像素是否在当前的 4x4 块之前已经完成编码，即已经是经过重建了的图像。如果 4x4 块 EH 参考像素所在的 4x4 块尚未编码，那么它们的 EH 参考像素是不可用的。另外，如果 EH 不可用而 D 是可用的，则用 D 来替代 EH 并将 EH 标记为可用。在决定了哪些参考像素可用后，就可以通过它们产生预测值了。一共定义了 9 种 Intra _4x4 预测方式，除了 DC 方式 (模式 2)之外，其它 8 种都是向某一个方向上进行预测，也就是做外插。这 8 个预测方向和预测的方式如图所示：图 4x4 块的 8 个预测方向由图中可以看出，如果某一块区域内的像素值呈现出一种方向性，那么选用与这个方向相近的某个预测方式，将会达到较好的预测效果。作为空间相关性的8 6 1 4 5 0 7 3 8 一种表现，在空间上相临的块其预测模式也是相近的，所以对于 Intra 4x4 预测，并不直接编码各个块的预测模式，而是根据当前块左边和上边块的预测模式，对当前块的预测模式进行估计，只有当前块的预测模式和这个估计出来的预测模式不相同时才额外传送当前块的预测模式。色差分量的帧内预测该预测针对的是当前宏块的两个 8x8 的色差分量 Cr和 Cb，共有 4 种模式，两个 chrominance 分量采用相同的预测模式，预测对两个分量分别进行，预测的范围是整个 8x8 的色差分量。预测的参考像素是同一个 chrominance 分量的周围17 个像素。预测的过程同 16x16 基本相似，首先判断这 17 个参考像素的可用性(availability)，然后进行预测。帧间预测树型构造的运动补偿编码支持从 16x16 到 4x4 范围尺寸的运动补偿块，在这个范围中亮度样本可有多个选择。每个图像宏模块亮度组件可以按 4 种方式分开（如图 1 所示）：16x1 16x 8x16 和 8x8。每一个被分的子区是宏模块的一部分。如果选择了8x8的模式，每一个 8x8模块被按 4种模式分成多个子块（如图 2所示）： 8x 8x4x8 和 4*4 (被称作宏模块子区 )。这种模块区和模块子区在每个宏模块产生大量的组合。这种划分宏模块为各种尺寸的动态子模块的方法被称作树型运动补偿。每一个区和子区要求由各自的运动矢量描述。每一个运动矢量都要被编码和发送；除此之外，所选的区需在压缩的比特流中编码。选择了大的区域意味着用少量的比特数据去描述运动矢量和区域类型。然而，经过补偿后的运动的画面还有大量的运动细节描写。选择小的区的划分会在使用运动补偿后产生少量的编码。因此，选择分区的尺寸大小具有显著的意义。总之，大的分区适合均匀的区域，小的分区适合描述细节。在宏模块中每一个显示组件的分辨率是亮度组件的一半，每一个显示被按同一方式分成亮度元素。 1/4 像素精度的运动估计帧间编码宏块的每个分割或者子宏块都是对参考图像的某一相同尺寸区域进行预测而得到的。两者之间的差异（ MV）对亮度成分采用 1/4 像素精度，色度1/8 像素精度。亚像素位置的亮度和色度像素并不存在于参考图像中，需利用邻近已编码点进行内插而得。如果 MV 的垂直和水平分量为整数，参考块相应像素就已实际存在。如果其中一个或两个为分数，预测像素则要通过参考帧中相应像素内插获得。多参考帧模式选择标准为帧间图像编码提供了多参考帧选择 ,可选择 5 个不同的参考帧，进行帧间预测，这使得帧间编码更加有效，恢复视频的主观效果更好，而且，使用多参考帧将会有助于比特流错误的恢复，这样比单独参考帧方法可以节 9 省 5 %～ 10 %的传输码率。另外，图像编码顺序不是基于时间的图像显示顺序，而是基于图像之间的依赖关系。变换与量化将图像的当前像素值与预测值相减，就形成了预测残差。残差内仍然含有空间冗余，为了消除这种冗余，通常采用变换编码，即变换－量化－熵编码三步。变换并不压缩数据，它只是消除数据中的相关性，或者说将数据中的冗余 (或相关性 )以一种便于随后进行熵编码的方式表现出来。压缩是在熵编码步骤中完成的。此外为了进一步减少数据量，编码器还对变换后的系数进行量化，它的实质是减少数据的取值范围以减少每一个符号的熵。它会造成信息的损失，是有损编码的一个重要步骤，它也是控制图像率失真 (RD)特性的一个主要手段。在中，变换与量化两个步骤紧密相连。整数 DCT 变换图像编码中常用的变换是 DCT，因为它在某种条件下近似于理论上最优的KL变换。但是如果直接采用 DCT的定义进行变换，会带来两个问题：一个是需要进行浮点数操作，从而造成系统设计上的复杂性：第二，由于变换核都是无理数，而有限精度的浮点数不可能精确地表示无理数，再加上浮点数的运算可能会引入舍入误差，这就使得在具体实现时会导致编解码的不一致 (mismatch),即反变换的输出结果和正变换的输入不一样。为了克服这些问题，采用整数 DCT变换，使得变换操作仅用整数加减和移位操作就可以完成，这样既降低了设计复杂度，又避免了编解码的不一致，而由此带来的编码性能的减少微乎其微。需要注意的是，此时的变换已经不是真正的 DCT，仍然称其为 DCT 变换只是为了说它是由 DCT推导而来，且为了和另一个哈达玛变换 (Hadamard 变换 )相区别罢了。编码器的变换与量化过程如图所示： 10 图编码器变换与量化过程图中输入为预测残差，输出为准备进行熵编码的数据，一共有五类。为了更大程度地利用空间冗余，对于 16x16 帧内预测模式，在对 16x16 的 luminance分量的 16 个 4x4 块进行 DCT变换后，将每个 4x4 块的 DC 系数 (还没有经过量化 )提取出来，组成一个 4x4的 luminance DC 块，对其再进行 4x4的哈达玛（ Hadamard）变换。同样，对 8x8 chrominance 分量的 4 个 4x4 块进行 DCT变换后，也将每个4x4 块的 DC 系数提取出来，组成一个 2x2 的 chrominance DC 块，对其进行 2x2的 Hadamard 变换。量化一般量化原理为： FQ=round(y/QP) 其中： y 为输入样本点编码， QP 为量化步长， FQ 为 y 的量化值， round()为取整函数。熵编码在完成变换与量化之后，这些数据就送往熵编码器，完成整个变换编码的最后一步。一共有 3 种熵编码： (1)ExpGolomb 码 (Exponential Golomb codes)。 (2)CAVLC (Contextbased Variable Length Coding): (3)CABAC(Contextbased Adaptive Binary Arithmetic Coding). 对这三种码的使用范围做了规定 :(1)不出现在残差数据中。 (2)仅出现在残差数据中 :(3)仅出现在 Slice 层以下 (从 Slice data 开始 )的数据中。 (1)和 (2)都是采用查表方式，但是 (1)的表是固定的，而 (2)在编码过程中会根据周围宏块以及在之Hadamard 变换 44 整数 DCT变换 44 Hadamard 变换 22 整数 DCT变换 44 整数 DCT变换 44 DC 系数量化 AC 系数量化 AC 系数量化 AC 系数量化 AC 系数量化 AC 系数量化 DC 系数量化AC 系数量化 AC 系数量化 16*16 4*4 其他 DC DC 11 前编码的数据信息，选择不同的表，从而具有上下文自适应功能。 (3)属于自适应算术编码，能够获得比 (2)更好的压缩性能和自适应能力 .。 ExpGolomb码 ExpGolomb 码的编码过程分为两步 :第一步将待编码的数据转换为一个中间变量 codeNum。根据转换方式，可将 ExpGolomb 码分为 4 种，按的记号分别表示为 uc, mc, sc 和 uc 和 sc 分别用于无符号整数和有符号整数的编码， mc 用于对 coded_block_pattern编码，这是表示当前宏块中哪些子块含有非零系数的一个参数， to 用于编码 ref_idx_10 和 ref_idx_l1，该参数表示使用缓存中的哪个参考帧做帧间预测，第二步是将 codeNum映射为二进制编码。 CAVLC CAVLC 是基于上下文的自适应变长码的英文简称，它用于编码预测残差。 VLC 的基本思想是对经常出现的符号赋予较短的码字，反之则较长。与一般的VLC 码不同的是， CAVLC 能够根据以往编码的数据在若干码表中自适应地选择，找出与当前编码数据统计特性最相符的一个码表来进行编码 .并且它将以前标准中所采用的 (Run, Level)二元组拆开来，分别进行编码，从而能达到更好的自适应性，提高了编码性能。由于 CAVLC 改进的编码性能以及实现简单，它被 JVT所采纳，同上面的 ExpGolomb 码一起代替了原先的 UVLC. CAVLC 的设计考虑了如下几个事实： 1）经过变换与量化后的预测残差中含有较多的 0，这样在 ZigZag扫描之后，用 Run和 Level 表示预测残差可以取得较好压缩效果。这一点在以前的标准中也用到了。这里 Level表示非零系数值 Run表示非零系数之前的 0 的数目 . 2）残差末尾的几个非零系数一般为 +1 或 1， CAVLC 对它们单独进行了编码。 3）作为空间相关性的一种表现，当前块中的非零系数个数和周围块的中的非零系数个数应该差不多， CAVLC 利用这一点自适应地选择编码当前块中非零系数数的码表。 4）位于低频处的系数值一般较大，而位于高频处的则相反， CAVLC 利用这一点自动地选择编码 Level的码表。 5）位于低频处的非零系数一般是连着的，中间没有零，此时用 (Run， Level)形式来表示它们就显得效率不高，因此 CAVLC 将 Run 和 Level 分开单独进行编码。 CABAC CABAC 只对二进制符号 0 和 1 进行编码，所以首先要对输入的 Syntax Element (SE)的值做二值化 (Bin－ variation)，即映射成一串 0， 1 序列，序列中的 12 每一个二进制符号称为一个“ bin, bin是 CABAC 的编码单元。对每一个 bin的编码包括两个步骤：选择 context 和进行算术编码。由于空间相关性， SE的取值与邻近相同的 SE取值是相关的，这样，描述当前 SE的概率就应该用条件概率模型。 Context 就是这样一个条。

阅读剩余 0%

本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体)，仅供学习参考。用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权，请联系我们反馈本站将在三个工作日内改正。

标签：视频压缩编码毕业论文

毕业论文视频压缩编码技术设计

相关推荐

密码登录

账号注册