毕业设计论文-cabac精品内容摘要:

................................................................................................... 39 总结与展望 .................................................................................................................................... 43 参考文献 ........................................................................................................................................ 44 附录 ................................................................................................................................................ 45 致谢 ................................................................................................................................................ 63 电信学院学士学位论文 1 第一章 绪论 数字视频技术在通信和广播领域得到了日益广泛的应用,随着互联网和移动通信的迅猛发展,视频信息和多媒体信息在互联网和移动网络中的处理和传输技术成为国内外专家研究的热点之一。 视频信息具有直观性、确切性、高效性与广泛性等一系列的有点,但其信息量太大,要使视频得到 有效的应用,必须首先解决视频压缩编码问题,其次既要解决压缩后视频质量保证的问题。 这两者是相互矛盾的,是矛盾的两个方面。 我们的任务是既要有较大的压缩比,又要保证一定的视频质量。 传统的视频编码技术主要是面向存储的,目标是单纯地追求某一固定码率下的压缩效率;随着计算机网络技术和 Inter 的迅猛发展,面向网络应用的视频服务正飞速增长,如:视频会议、可视电话、视频点播、视频监控等。 视频编码的目标由单纯的追求高压缩率转向了使视频流能够更好地适应各种不同的网络环境和用户终端,并具有一定的容错性和可伸缩性。 [1] 但是,视频(尤其是实时视频)对带宽、延迟和丢失率等都有一定要求,而现有的因特网提供的服务不能为视频应用提供服务质量保证。 并且,由于网络和接收端的异构性,使得很难充分利用现有网络带宽和资源、实现服务的灵活性。 由于网络的异构性和缺乏 QoS保证,带宽往往在一个较大范围内变化,在速率起伏很大的 IP( Inter Protocol)网络及具有不同传输特性的异构网络上进行视频传输的要求和应用越来越多。 因此对视频编码的要求不但是保证高压缩率,同时还要求编码后的视频流能够适应一定的网络带宽的变化,并具有一定的容错性和多 方面的可伸缩性针对网络应用对视频编码技术提出的特殊要求。 在这种背景下,视频可伸缩编码的重要性日益突出,其应用非常广泛,且具有很高的理论研究及实际应用价值,因此受到人们的极大关注。 可伸缩性视频编码有很好的应用前景,如无线局域网或 IP 网上传输视频流、网上直播、移动电子商务等。 因分层的可伸缩视频编码方法通常把每层的视频流分解成基本层码流和增强层码流,这就允许视频流可在不同的网络环境或流量中传输。 在 IP 网络中不同质量的视频流能被分配给一个或多个不同的客户端,因此根据网络流量的计费管理系统就可得到保证,如 DVBH 或 3GPP 的 MBMS 等网络,它们有不同能力的终端设备。 应用分层编码方法,如果网络支持某种网络流仅传输到某一设备,那么终端不必接受所有的位流。 例如在 MBMS 或 DVBH 网络中可能把 基本层码流发送到低性能的终端设备,位流的其他层发送到高性能终端设备。 用 可伸缩性码流代替联播,可大大减轻主干线的负担。 电信学院学士学位论文 2 可伸缩性视频编码另一个很有前途的应用是在视频监视系统中,一般来说,从许多摄像机得到的视频必须在终端设备上存储和显示,这可能有不同的空域或时域分辨率。 例如在一个监视器或在移动设备上(如可视电话或 PDA),许多场景分屏显示,从专用摄像机上观看场景,对这样的应用,可伸缩性视频编码很有吸引力,因为不需要代码或格式转换。 监视摄像机发送出来的大量数据必须存储起来,可伸缩性编码可在某一特定时间后删除已存场景的高分辨率层,仅把低分辨率复制到文档中,不必重新编码和复制,使存储更加灵活。 一般整个分辨率视频能保持 1~3 天,中间质量(减少时域或空域分辨率)的视频可保持一周,低质量(时域、空域分辨率同时减少)的视频可保持更长的时间。 [2] 研究概况 与 发展趋势 可伸缩视频编码( SVC)是目前国际上研 究的热点。 联合视频组( JVT)围绕 SVC 展开了大量的研究工作,提出了作为 ,实现了时域、空域和质量( SNR)的可伸缩性。 ,越来越多的视频应用已经或即将采用。 由于存在不同的网络和不同的终端,因此对于视频编码的可伸缩性方面的要求也越来越迫切。 所谓的可伸缩视频编码( scalable video coding: SVC)技术包括空域可伸缩性(分辨率伸缩),时域可伸缩性(帧率伸缩),质量可伸缩性和复杂度可伸缩 性等,要求视频编解码器在比特流级别具有以下可伸缩特性:通过简单的丢包或截断码流等操作提取出的子码流具有较低的空间-时间分辨率和 /或较低的码率(对应于较低的视频质量),同时任何可能子码流的编码效率应该与相应非可伸缩视频编解码器相当。 当前国际上对于视频编码技术的研究热点逐渐集中于在 视频编码。 2020 年 1 月, ISO 的 MPEG 和 ITU- T 的 VCEG,同意联合起来将 SVC 作为( JVT)提出了草案,收录为。 此后 ,每次 JVT 的会议都围绕着 SVC 技术对草案进行修订和完善。 在 2020 年 10 月的 JVT会议上,提出了。 [3] ,扩展集中所采用的 术都与 AVC 标准中的定义一致(例如,运动补偿预测, intra 预测,变换编码,熵编码,去块滤波器等),只加入或修改了很少一部分内容。 :( 1)时域分级预测结构;( 2)用于空域可伸缩性的层间预测机制;( 3)基本层与 兼容;( 4)用渐进细化片( progressive refinement slices)实现精细颗粒的质量可伸缩性;( 5)NAL 单元概念的使用和扩展。 在主要档次中采用了基于上下文的自适应二进制算术编码 (Contextbased Adaptive Binary Arithmetic Coding, CABAC)。 CABAC 是一种高效的熵编码方法,它在计电信学院学士学位论文 3 算的复杂度和编码效率之间作了折衷,建立了基于查表的概率模型,对乘法运算也作了优化,从而获得很高的编码效率。 国内外有许多的专家学者都对 CABAC 做了 大量的研究,包括:如何进行 CABAC 的软硬件实现的算法设计以达到效率的进一步提高;针对编码时间较长的重要图的 CABAC编码算法进行优化,降低其计算复杂度,减少其内存访问次数;优化上下文模型的表征,降低 CABAC 编码器与内存之间的频繁访问和上下文模型表格初始化时的 CPU 计算量;通过牺牲少量的编码准确度来降低 CABAC 的计算复杂度,提高编码速率;在 CABAC 过程中引入子表法与流重用发,来提高编码精确度,等等。 被认为是传统视频编码技术的领导者,通过多种新技术的应用使编码效率得到很大的提高,在 Mbit/s 左右速率下就可以达到接近 DVD 的画质效果,但是由于其实现复杂度非常高,大规模工业化使用还尚待时日。 目前市场上已有的一些 编码产品,多数只实现 标准的部分算法,未能完全发挥 的编码效率,预计形成成熟的产业链还需 一段 时间。 在标准化方面, 无疑是最为全面的,它能够支持从低码率的手机、电视到高码率的高清晰电视等多种应用方式。 而 中可伸缩性编码将来的发展方向应注重编码效率的提高及算法复杂度减小。 我主要的研究工作包括以下几个方面: 以 为主,研究各种可伸缩视频编码技术 ; 研究 CABAC 编码协议以及 源程序的相关部分,将源程序的流程与编码过程对应起来 ; 深入研究并理清 CABAC 对图像的各种句法元素的编码过程 ; 分析比较 CABAC 的 性能。 本文安排 本文余下内容将如下安排。 第二章将详细介绍 标准 (下文凡提到“标准”,均指文献 [4]) 中的 基于上下文的自适应二进制算术编码 CABAC, 包括对它的二进化,上下文建模与二进制算术编码这三种基本组成部分的 深入 描述。 第三章将解释 的官方测试源码 中涉及 到 CABAC 的部分 程序,并与标准相对应。 第三章将通过 分析CABAC 的性能,并与 CAVLC 相比较。 具体的章节安排见目录。 电信学院学士学位论文 4 第二章 标准中的 CABAC 又名“ MPEG4 AVC(Advanced Video Coding)”,是国际电信联盟电信标准化部门( International Telemunications Union- Telemunication Standardization Sector ,ITUT)与国际标准化组织( International Organization for Standardization, ISO)联合开发组共同开发的最新国际视频编码标准,于 2020 年 5 月发布了第一个版本。 在该标准中采用了一系列先进的编码技术,在编码效率、网络适应性等诸多方面都超越了以往的视频编码标准。 其中,为了改进以往标准中熵编码 (Entropy Coding)存在的编码效率低、重建效果差以及存在一些不可避免的帧间符号冗余等不足, 中规定了两种熵编码的模式,即基于上下文的自适应二进制算术编码 (Contextbsaed Adaptive Binary Arithmetic Coding, CABAC)和基于上下文自适应可变长编码 (Contextbsaed Adaptive VariableLength Coding,CAVLC )。 熵编码直接对变换编码后的系数进行编码。 视频信号间有很强的非静态统计依赖性,这些统计特性很大程度上依赖于视频内容和图像获取方式。 传统的编码思想是将视频信号的比特流映射成一个个不同码字长的语法元素,这种变长编码仅仅利用了这些非静态统计特性中的一部分进行压缩,而在以往的视频编码方案中,存在于语法元素数值之间的高阶统计 依赖性则基本被忽略了。 CABAC 是 ,是将自适应的二进制算术编码与一个设计精良的上下文模型结合起来得到的方法。 它很好地利用了语法元素数值之间的高阶信息,使得熵编码的效率得到了进一步提高。 它的主要特点有:利用每个语法元素的上下文关系,根据已编码元素为待编码元素选择概率模型,即上下文建模;根据当前的统计特性自适应地进行概率估计;使用算术编码。 [5] 图 展示了在 CABAC 中编码一个单独的句法元素的通用方框图。 这个编码过程 主要由三个基本步骤组成: 二值化; 上下文建模 ; 基于表格的 二进制算术编码。 在第一步,一个给出的非二进制值的句法元素唯一地对应到一个二进制序列,叫二进制串。 当给出一个二进制值的句法元素 时 ,这一初始步骤将被跳过,如图 1 所示。 对于每个元素的二进制串或每个二进制值的句法元素,后面会根据编码模式有一两个子步骤。 接下来就是对二元数据进行编码,标准中有两种编码模式可供选择。 在常规编码模式( regular coding mode)中,一个 句法元素 的每一个 二进值 ( bin)按其判决产生的顺序进入电信学院学士学位论文 5 上下文模型器,在这里,模型器根据已经编码过的 句法元素 或 二 进值 为每一个输入的 二进值 分配一个概率模型,这就是上下文模型化。 然后该 二进值 和分配给它的概率模型一起被送进常规算术编码器进行编码,此外编码器还要根据该二元位的值反馈一个信息给上下文模型器,用以更新上下文模型,这就是编码中的自适应;另一种模式是旁路编码模式( bypass coding mode),在该模式中,没有模型器为每个 二进值 分配一个特定的概率模型,输入的二元数据是直接用一个简单的旁路编码器进行编码的,这样做是为了加快整个编码(以及另一端解码)的速度,当然,该模式只用于某些特殊的 二进值。 后面将更加详细地讨 论二值化,上下文建模与基于表格的二进制算术编码这三个主要步骤以及它们之间的相互联系。 图 CABAC 编码器方框图 CABAC 的二值化方案 有四种基本类型:一元码,截断一元码, k 阶指数哥伦布编码,与定长编码。 此外,还有基于这些基本类型的联合的 二值化 方案 与基于查表的二值化方案。 一元码 ( Unary) 对于 一个 非二进制 的 无符号整数值符号 x≥ 0,在 CABAC 中的一元码码字由 x 个“ 1”位外加一个结尾的“ 0”位组成。 例如 ,输入的句法元素值为 4, 其二值化 结果为。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。