mpeg-4视频编码技术分析内容摘要:
3 视频序列编码的压缩方法 在过去的 30 多年中,视频压缩技术获得了飞速的发展。 视频数据之所 以能进行高倍率的压缩,是因为视频数据的空间域和时间域存在着大最的数据冗余,通过降低空域冗余和时域冗余就可以对视频数据进行有效的压缩。 为了获得更高的压缩编码效率,编码技术也变得越来越精细和复杂。 但是,最基本的 DCT(离散余弦变换)变换编码、 VLC(可变长编码)统计编码、运动估计等技术仍 免费论文 购买论文 定做论文 发表论文 3A 学习网 () 考试 3A3B 书店 零售书籍 预定书籍 批发服务 同行配书 :1009874606 9 然是最广泛使用的编码技术,人们在这些编码方法的基础上不断提出了改进算法和新的编码方法。 我们利用一个简化的编码器模型进行了相关试验。 该编码器采用整象素全搜索块匹配运动估计方法、采用 DCT /IDCT 对宏块进行编码,用 Miss America 测试序列进行测试。 试验结果表明,运动估计占用的时间超过了整个执行时间的 70%,DCT/IDCT 处理约占用 15%的执行时间,数据量化占用了约 5 %的执行时间,其它开销占整个时间的 10%左右。 这说明,采用高效的运动估计算法,减少时域数据冗余是 述场景中声视频对象的空间和时间位置及它们之间的关系。 MPEG4 的视频比特流提供了对场景的分层描述。 在比特流中 ,表示场景的层是可视对象序列VS(Video Object Sequence), 它是一个完整的 MPEG4 场景 , 其中可能包含自然对象或合成的对 象以及它们的增强层。 VOP 的形状、运动和纹理信息编码 MPEG4 视频 VOP 基本的编码结构包括形状编码 (对任意形状的视频对象 )、运动补偿以及基于DCT 的纹理编码 (使用标准 8 8DCT 或形状自适应 DCT)。 编码器首先对输入的任意形状的 VOP 序列用基于块的混合编码技术编码。 先帧内 VOP, 后帧间 VOP 和双向预测 VOP。 在对 VOP 的形态状信息编码之后 , 取得任意形状 VOP的采样 ,每个 VOP 划分成各不相交的宏块 , 每个宏块含有四个 8 8的像素块 , 以进行运动估计和补偿及纹理编码。 已编码的 VOP 帧保存在 VOP 帧存储器中。 运动矢量在当前 VOP 帧和已编码 VOP 帧之间计算。 对将被编码的块或宏块 , 计算其运动补偿预测误差。 运动补偿预测后的 VOP及误差用 8 8 块 DCT11编码 ,并进行 DC系数的量化 , 然后进行行程编码和熵编码。 最后 , 形状、运动和纹理信息合成符合 MPEG4 标准的比特流输出。 纹理编码、运动估计与补偿基本采用传统的编码方法 , 而形状编码是首次引入的视频编码技术。 对输入的矩形或任意形状的图像序列 ,图描述了 MPEG4 进行压缩编码的基本算法。 如图 9 所示。 图 9 MPEG4 视 频编码方框图 1 形状编码 MPEG4 标准中视频对象 VO 的形状信息有两类 : 二值形状信息和灰度形状信息。 二值形状信息通常表示为与 VOP 的边界框相同大小的矩阵。 矩阵的每个元素可以取两种可能的值 0、 1,这取决于像素是在视频对象内还是在视频对象外 ,0 表示该像素在 VOP 区域之外 ,1 表示在 VOP 区域之内。 对二值形状信息进行编码时可以采用基于块的运动补偿技术 , 可以是无损或有损编码。 灰度形状信息 免费论文 购买论文 定做论文 发表论文 3A 学习网 () 考试 3A3B 书店 零售书籍 预定书籍 批发服务 同行配书 :1009874606 10 与二值形状信息有相同的结构 , 用 0~ 255(8 比特 )之间的数值表示该像素的透明度 ,0 表示完全透明 , 255 则表示完全 不透明 , 中间值对应用像素的相应的透明度 , 这与计算机图形学中的阿尔法平面的概念大致相同。 编码时采用基于块的运动补偿 DCT 方法 , 属于有损编码。 2 运动信息编码 运动估计与运动补偿技术通过对已知图像的一块像素值重新定位 , 来预测当前图像中相应块的像素值。 MPEG4 与 MPEG MPEG2 一样利用运动估计与补偿来减少帧间的时间冗余度。 主要区别在于后两者的压缩基于块 , 而 MPEG4 则是基于任意形状的 VOP。 VOP 有 3 种编码模式 : 帧内编码模式 (IVOP)、帧间编码模式 (PVOP)和帧间双向预 测编码模式 (BVOP), IVOP 与其它标准的 I 帧一样只采用帧内压缩 , 与其它任何 VOP 无关。 PVOP 和 BVOP 编码时需要运动估计与运动补偿 , PVOP 基于另一个先被解码的 VOP 作出预测 ,BVOP 则基于当前 VOP 的前面和后面的 VOP 作出预测 ,故 B VOP 称为双向插值 VOP, 是基于 IVOP 或 PVOP 的插值帧。 如果一个宏块全部位于一个 VOP 内 ,则采用通常的基于 16 16 像素宏块或 8 8 像素块运动估计 , 如果一个宏块只有一部分位于 VOP内 , 则需要采用图像填充 (Image Padding)技术和多边形匹配(Polygon Matching)技术。 图像填充技术利用 VOP 内部的像素值来外推 VOP 外的像素值 , 以此获得运动预测的参考值。 多边形匹配技术则将 VOP 的轮廓宏块的活跃部分包含在多边形之内 , 以此来增加运动估值的有效性。 这样在 VOP 的边界上就可以搜索预测所需的候选像素了。 3 纹理编码 纹理编码的对象可以是帧内编码模式的 IVOP, 也可以是帧间编码模式 BVOP 或 PVOP 运动补偿后的预测误差。 对纹理信息编码时 , 采用标准的基于 8 8 像素块的 DCT 方法。 VOP 内部的 88 块可直接编码。 跨出边界的块成为边界块 , 而对于横跨 VOP 边界的块 , 先采用图像填充技术得到VOP 之外的像素值 ,再进行编码。 魔景 (Sprite)编码 MPEG4 中引入了魔景的概念是基于提高视频的压缩效率的目的。 从摄像机得到的图像主要分为为主体和背景两类。 主体可以千变万化 , 背景却是相对静止的。 魔景就是由视频对象出现在背景中的那些区域组成 ,这些区域在整个视频段中都有可能出现 ,通过图像的镶嵌技术把整个序列的背景图像拼接成一个大的完整的背景图像 ,这个图像叫做 Sprite 图像。 我们只对主体这一可能产生任意动作的视频对象单独编码。 而将背景图像一次性地传送给接收端。 以后对于同一个镜头中的每一帧图像 , 就只需要传输 Sprite 信息 , 接收端可根据这些信息自行生成背景内容。 然后将主体叠加上去 , 就能得到完整的图像。 由于整个过程中只需传送一次背景图像 , 因此 M PEG 4 的编码效率得到了 免费论文 购买论文 定做论文 发表论文 3A 学习网 () 考试 3A3B 书店 零售书籍 预定书籍 批发服务 同行配书 :1009874606 11 提高。 魔景编码通常适用于合成对象。 MPEG4 视频编码特点 基于对象的编码是 MPEG4 视频编码最重要的特点之一 , 在 MPEG4 中对象既可以是自然的图像 ,为零,能量百分比很小。 我们在低频域设计较小的量化阶距值,而把高频域的量化阶距值设计的较大。 这样在低频域可以细量化,不至于丢失太多的能量 ,不会产生很大的误差;而在高频域进行粗量化,产生更多的零值,但不会有很大的影响,可以使得总体的编码效果可以更好。 帧间宏块的缺省量化矩阵为(如图 12 所示)。 图 12 帧间宏块的缺省量化矩阵 帧内和帧间的量化矩阵是不同的,因为它们所面对的经过上一步编码产生的数据的特点是不同的。 如上所述,帧内编码时要尽量使 DCT 变化后的矩阵的系数的能量集中在 DC 段,与之相适应,采用了图 12 所示的量化矩阵。 而对 PVOP 或者 BVOP 来说,它们由其前向帧或者后向帧重建而成,所以在空域是基本没意义的,所以各个系数的量化步长基本相同。 可变长编码( VLC ) 虽然 Huffman 码对于给定的消息概率集是最有效的最优编码,但是由于它的长度变化很大,码字结构过于复杂,具体实现起来就比较困难。 为了简化实现编码的复杂度,可以牺牲一些压缩比,16 17 18 19 20 21 22 23 17 18 19 20 21 22 23 24 18 19 20 21 22 23 24 25 19 20 21 22 23 24 26 27 20 21 22 23 25 26 27 28 21 22 23 24 26 27 28 30 22 23 24 26 27 28 30 31 23 23 25 27 28 30 31 33 免费论文 购买论文 定做论文 发表论文 3A 学习网 () 考试 3A3B 书店 零售书籍 预定书籍 批发服务 同行配书 :100。mpeg-4视频编码技术分析
相关推荐
赛程找出与同部不同区球队比赛中,选取赛 3场的球队的方法。 这种方法如何实现,对该方法给予评价,也可以给出你认为合适的方法。 我们经常会听到或看到球员、教练和媒体对 NBA 赛程的抱怨或评论,说明赛程的安排对 球队实力的发挥和战绩有一定的影响,因此 NBA 赛程的安排中存在一定的不公平性与不合理性。 问题一要求我们找出赛程安排对球队利弊的影响因素,并将赛程转换为便于数学处理的数字格式
nitialColor),其中参数 Component 指定对话框所依赖的组件,即文本编辑器中的文本区 area, title 指定对话框的标题“调色板”, initialColor指定对话框返回的初始颜色,即对话框消失 后,返回默认值。 三、 建立 Choice下拉列表实现对字体的设 计 Choice list。 GraphicsEnvironment ge=()。 String
需要。 软件方面,编程的软件以及 Web 服务器等均已具备,并且环境变量已经搭好,数据库用 MySQL存储大量的数据, MySQL 开源化,目前已经很成熟,在灵活、安全和易用方面均能提供良好的支持。 因此,系统的软件开发平台已经成熟可行。 设计目标 在线考试系统的总体目标: 1. 本系统提供给管理员类用户 、教师类用户 及学生类用户使用。 不同的用户类型所能完成的功能不同。 管理员类用户可以
5 开发与实现 开发环境 (1)硬件环境(服务器端和客户端) (2)软件环境 Win2020 advanced server 2020+++SQL server 2020 系统总体方案的设计与实施 (1) 网 站内容规划 (1)域名: (2)网页规划 6133 站点的网页设计应简洁、美观,界面应与书店形象相符,网页大小有所限制,网页必须响应及时,可以采用多种浏览器浏览,便于检索