远程数字电视会议系统设计本科毕业论文(编辑修改稿)内容摘要:

比特流协议合成帧 传输网络 第二节 视频会议标准 ITUT 于 1996 年批准了 规范。 该协议族制定了基于无 品质保证的包交换网( Inter) 上开展交互视听业务的标准,它涵盖了个人计算机技术、以及点对点和点对多点视频会议以及各种独立设备,描述了各类实体设备间的通信服务,具体来说,协议主要提供了四类实体描述:网守、网关、终端、多点控制器,并提供了呼叫信令过程、呼叫模型、复用标准和控制消息等通信服务描述。 不同厂商的应用和多媒体产品被 标准准确描述并能够互操作,该标准解决了多媒体与带宽管理、视频会议中呼叫与会话控制等许多问题,实现了不同设备间的互通,它涵盖了 IP 基础网络如: Inter、 LAN、 EXTRANET等网络多媒体及数据形式的通信。 该标准也允许通过 POTS 和 ISDN 与基于 PPP 的网络直接相连。 标准对于范围广泛的基 于 IP 网络的多媒体通信应用来说是非常重要的标准。 标准下的通信可以看成是音频、视频、数据和控制包的混合体。 音频功能、 呼叫建立、 RAS 控制以及 信令是必须的。 所有其它功能,包括视频和数据会议,都是可选的。 当编码器支持多种编码算法时,编码器使用的算法由解码器根据 协议传送过来的信息决定。 终端也能不对称地工作(不同的编码和解码算法),并 能发送 /接收多个视频和音频通道。 呼叫控制功能是 重庆邮电大学移通学院本科毕业设计(论文) 9 终端的核心。 整个系统的控制由三个不同的信道提供: 控制信道、 呼叫信道和RAS 信道,控制功能包括呼叫建立信号、性能协商、命令和指示信号以及开通并描述逻辑信道内容的信息。 所有的音频、视频和控制信息经过控制层处理,输出到网络接口,对于输入信息流,过程正好相反。 控制信道是传送控制信息的可靠信道,这些控制信息支配 实体的运作,包括性能协商、开通和关闭逻辑信道、优先选择请求、流控制信息以及通常的命令和指示。 一、 的协 议框架 如表 所示为 的协议框架: 表 协议框架 声像应用 数据应用 终端控制和管理 音频编解码 视频编解码 RTCP RAS RTP UDP TCP TCP UDP TCP IP :协议框架,描述以下协议如何协同工作。 :定义呼叫信令( )以及节点和 GK( RAS)之间的通信。 RTP/RTCP:实时传输协议,用来传输视、音频流。 系列:如何召开数据会议。 RAS(注册 ,许可 ,状态)是终端和网守之间。 执行的协议,基本是管理功能,控制其所。 在域内端点的信令协议。 协议是呼叫信令协议,在端点间建立和拆除呼叫。 协议,主要针对会议通信设计。 它是与会者用来建立和控制媒体流的协议。 确保与会方就发送和接收媒体格式和带宽重庆邮电大学移通学院本科毕业设计(论文) 10 要求达成一致。 二、基于 协议的网络组成构架 如图 ,由终端,网守,网关,多点控制单元(包括多点控制 MC,多点处理 MP)四部分组 成。 终端、网关、多点控制单元统称端点:可以发起呼叫,可以接收呼叫,媒体信息流在端点生成和终结。 网守、多点控制器、多点处理器统称功能实体不可呼叫。 图 协议网络的 组成 如图 ,终端具有音频编解码功能,提供系统控制接口。 如图 所示,网关提供 网络与非 网络之间的转换功能。 主要包括:转换协议如 PSTN、 ISDN 网络通信;传递信息。 图 协议网络的 终端 重庆邮电大学移通学院本科毕业设计(论文) 11 网守向 终端节点提供地址转换及呼叫控制服务。 同时它还负责带控制,这是一系列操作的集合,允许终端 节点改变在 IP 网络上分配的带宽。 一个网守将管理一组终端、网关及 MCU。 这个组称为一个区域,一个区域是由这些元素构成的逻辑联系。 图 协议网络的 网关 网守提供这些功能:地址解析,别名和网络地址之间的翻译。 接入控制,网络资源使用许可,身份验证。 带宽控制,初始带宽申请,带宽改变控制。 区域管理,下辖设备的管理。 多点控制单元( MCU)支持在三个或三个以上的终端和网关之间的多点会议。 如图 所示, MCU 包括一个命令多点控制器( MC)和可选的多点处理器( MP)。 MC 支持与所有终端进行协商的能力,用以保证通 信达到一个普遍的水平。 MP 在 MC 的控制下在进行多点会议时,具备对语音、视频或者数据业务的混合或交换能力。 MP 是处理语音、视频以及数据流的主处理器。 图 协议网络的 网守 重庆邮电大学移通学院本科毕业设计(论文) 12 第三节 标准 1990 年 CCITT 正式通过了针对通过电话线的可视电话、视频会议以及其它多媒体通信的视听业务编码器 建议。 标准采用混合编码,即同时使用两种或两种以上的编码方法进行编码的过程。 试想如果同时结合波形编码方法和参量编码方法,则可得到集合了两者优势的的编码。 标准使用的编码 有:统计编码、离散余弦变换、运动补偿帧间预测,最终得到特定码流 [12]。 建议图像格式采 用 CIF( Common Intermediate Format),有效区域像素为 176144(色差信号)和 352288(亮度信号)。 视频压缩算法的具体过程 : 压缩编解码算法主要分为帧内编码和帧间编码。 帧内编码系统单独压缩视频的每一帧(有时为每一场),其算法优点是提供了精确的帧定位,便于编辑,但它们的数据量比帧间算法要大 2~ 10 倍。 在帧内模式,不进行 DPCM运算。 图像中每个 88 的子块经 DCT 变换后 生成 DCT 系数,然后对系数量化和墒编码,最后送给复接器与其他边信息复接到一起构成一路比特流。 此图像帧经类似的反处理后存入帧存中,用于帧间编码。 帧间编解码器使用了有效的双向预测、运动预测和 DCT 的组合,以达到高压缩比,从而实现低码率,这类算法的典型例子包括 MPEG 与 系列算法 [13]。 在帧间模式中,耍进行帧间 DPCM 编码。 首先,当前帧中的亮度宏块和前一帧相应位置的亮度宏块进行比较,产生活动物体的运动估值;然后,利用此运动矢量对前一帧中的运动物体进行运动补偿,得到相应的预测宏块。 如果当前宏块和预测宏块 的差值小于一定门限,则此宏块的数据不进行 DCT 变换,而是在收端用预测宏块代替当前宏块。 反之,差值进行 DCT 变换、线性量化及熵编码,然后与运动矢量等边信息一起送到复接器组成一路比特码流。 当需要时,可以通过把环路滤波打开或关闭来滤除高频噪声,以提高图像质量。 根据传输缓存器中的数据多少,编码器自适应地调整量化步长。 当缓存器接近写满时,增加量化步长以减少编码数据量,但这将导致图形质量下降。 另一方面,当缓存器不满时,减少量化步长,提高图像质量。 为了进一步提高编码效率,在源编码之后紧接着采用变字长熵编码技术。 熵编码技术 在量化后的 DCT 系数的统计特性基础上,通过使它们更加紧凑而实现无失真压缩。 熵编码可看成由两部分组成: ○ 1 把量化后的系数序列转化成中间符号序列; ○ 2 把符号转换成码流,此时符号表面上不在有可确认的边界。 常用的熵编码有霍夫曼编码和算术编重庆邮电大学移通学院本科毕业设计(论文) 13 码两种。 连续图像的编解码器使用霍夫曼编码,但是对于操作的所有模式,编码器规定了具有上述两种熵编码的方法。 算术编码比霍夫曼编码可提高 10%的压缩效率,但实现较为复杂。 霍夫曼编码需要定义一个或多个编码表,而且压缩图像和解压缩图 像需要相同码表,霍夫曼码表可以预先设置和使用内部默认的码表,也可在实际压缩之前先对给定训练图像进行统计搜集以得到特定码表。 在 建议中,对于 DCT 系数有 5 个变字长码表和各种边信息。 视频复接器的输出送到传输缓存器,通过控制量化器的量化步长,缓存器起到平滑码流作用,防止其出现上溢出或下溢出,以保证输出码流的码率为恒定值,达到某种预定的图像质量要求。 为能够支持实时编码,采用不对称的压缩算法十分必要。 对于对称算法,压缩处理和解压缩处理需要相同的运算量;而不对称压缩算法中解码器比编码器需要更少的运算量。 在理论 上,这可使解码器成本降低。 但随着集成电路技术的不断进步,特别是编解码系统芯片的出现,采用不对称压缩算法的优势已经变得不十分明显。 第四节 标准 CCITT 在 标准发表以后又推出了 标准,他的码流数据格式与 标准不同,但压缩原理基本相同。 虽然 标准的速率的适应的范围很宽,高、低端速率可完全涵盖 标准,但它仍属于低比特图像压缩编码标准,它是图像视频编码标准,主要应用于 IP 网络的视频会议系统之中。 是国际电联 ITUT 的一个标准草案,是为低码流通信而设计的。 但实际上这个标准可用在很宽的码流范围,而非只用于低码流应用,它在许多应用中可以认为被用于取代。 的 编码 算法与 一样,但做了一些改善和改变,以提高性能和纠错能力。 标准在低 码率 下能够提供比 更好的图像效果,两者的区别有: 的 运动补偿 使用半 像素 精度,而 则用全像素精度和环路 滤波 ; 数据流 层次结构的某些部分在 中是可选的,使得编解码可以配置成更低的数据率或更好的纠错能力; 包含四个可协商的选项以改善性能; 采用无限制的运动 向量 以及基于语法的算术 编码 ;采用事先预测和与 MPEG 中的 PB 帧一样的帧预测方法; 支持 5 种分辨率 ,即除了支持 中所支持的 QCIF 和 CIF 外,还支持 SQCIF、 4CIF 和 16CIF,重庆邮电大学移通学院本科毕业设计(论文) 14 SQCIF 相当于 QCIF 一半的分辨率,而 4CIF 和 16CIF 分别为 CIF 的 4 倍和 16 倍。 实时的 视频 通信在实时情形下开发一个可以有效工作的 视频编码 和编码器时 , 有很多问题是要被说明的 , 包括 : 码率 控制实际的通信 信道 对于每秒钟它们可以处理的能力有限度。 在很多种情形下 , 码率是一个定值(比如说 POTS, IDSN 等) 编码器的基础是对于每个编码的帧生成一个变的码值。 如果 运动估计 /补偿过程工作正常的话 , 那么就有更少的非 0 系数被用来编码。 然而 , 如果运动估计工作不那么正常的话(比如说当视频场景中包括复杂的运动时) , 就会有很多的非 0 系数来被编码。 这样编码的值会增加。 为了映射这个可变的码率值到一个 CBR(固定码率值)信道 , 编码器必须进行码率控制。 编码器计算编码器输出的码率。 如果它太高的话 , 它会通过增加标量化因子来提高 压缩率 : 这会导致更高的压缩比(码率会更低) , 但也同时在解码器给出了更低的画质。 如果码率下降的话 ,编码器就通过降低量化器的标量化因子来进行压缩。 这样会在解码端造成更高的友率和更佳的画质。 同步编码器和解码器必须是同步的 , 特别是如果视频信号与 音频信号 一起的话。 码流包含了一定数目的 “ 头 ” 或叫标记 , 这些是特殊的记号用来标记解码器在当前帧 的所处的位置。 如果解码器失掉了同步 , 那么它就向前扫描下一个标记来重新同步并恢复解码。 应该注意到甚至是很小的同步上的损失都会造成很严重的解码质量的问题 .所以在这样一个充满了 “ 嗓音 ” 的传输环境中设计一个视频编码系统的时候必须非常小心。 音频和复用 标准只描述了视频编码。 在很多实际问题中 , 音频数据必须被压缩 , 传输和同步到视频信号中去。 同步 , 复用和协议问题被像 (基于 ISDN 的 视频会议 ) , (基于 POTS 的视频电信)和 ( LAN 或基于 IP 的视频会议)这样的标准解决掉了 提供了这些标准的视频编码方法。 音频编码被很多标准所支持 , 包括 等。 另外 , 相关的标准包含了像复用( )和信号机制( )。 第五节 本章小结 视频会议系统的标准有很多,本章介绍了 、 、 和。 分别说明了各个标准的主要内容,框架结构以及基于这些协议的网络组成构架。 这些标准主要针对的是视音频的编码、压缩、传输等方面。 重庆邮电大学移通学院本科毕业设计(论文) 15 第三章 视频会议的主要技术 第一节 压缩技术 一、视频编码技术 从编码前后信息量变化的角度出发,信息压缩方法分 为两类:一类是不允许有失真的编码,即所谓信息保持型编码,或称为熵 编码;另一类则是允许有一定量失真的编码,称为有限失真编码。 如果采用信息保持型编码,虽然用来表示图像或语音的比特数比原来有所减少,但它们所代表的信息量却和未编码前一样,因而由压缩后的信息所恢复出来的图像或语音将和原来的完全一致 [14]; 如果采用非信息保持型编码,则会由于在编码过程中丢失一些信息量而使恢复出的图像或语音出现一定程 度的失真,也就是说和原图像或语音并不完全一致。 一般说来,信息保持型编码的压缩比较低,非信息保持型编码的压缩比较高。 按照压缩编码所采用的算法不同,图像压缩编码的方法有三类,一类是消除图像时间冗余度的预测编码方法,另一类是消除图像空间冗余度的变换编码(尤其是离散余弦变换方法。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。