第3章声音3内容摘要:

unhofer协会 Coding Technologies公司在 2020年 6月联合推出了 MP3格式的升级版本Mp3PRO。 用 Mp3PRO压缩后的 MP3文件只有原来的一半 ,音质比原先的还好 . 2020/11/17 南京大学多媒体研究所 36 3 MPEG2音频 (1) MPEG2 Audio(ISO/IEC 138183), 或者称为MPEG2 多 通道 (Multichannel) 声音 , 又称为MPEG2 BC (Backward Compatible)。 (2) MPEG2 AAC (ISO/IEC 138187, Advanced Audio Coding), 也称为 MPEG2 NBC(NonBackwardCompatible)标准。 MPEG2 Audio(138183) 2020/11/17 南京大学多媒体研究所 38 MPEG2 Audio对 MPEG1的扩充  增加了 16 kHz, kHz和 24 kHz采样频率声音的处理 ,  扩展了编码器的输出速率范围 , 由 32~384 kbps扩展到8~640 kbps,  增加了声道数 , 支持。 MPEG2 音频编码器 16, , 24, 32, , 48kHz 8~640 kbps 2020/11/17 南京大学多媒体研究所 39 MPEG2的环绕立体声 MPEG2 Audio的 “ ” 也称为 “ 3/2立体声加LFE”, 放音现场前方有 3个喇叭 (左 、 中 、 右 3个声道 ), 后面有 2个喇叭 (2个环绕声道 ), “ .1”指 LFE(low frequency effects), 即低频音效加强声道。 2020/11/17 南京大学多媒体研究所 40 MPEG Audio的应用  优点 :  声音品质优良  码率范围较宽  多种不同配置  四 大应用领域 :  广播 ,  存储 ,  多媒体  通讯 MPEG2 AAC (Advanced Audio Coding) ( ISO/IEC 138187 ) 2020/11/17 南京大学多媒体研究所 42 MPEG2 AAC的性能  取样频率 : 从 8 kHz到 96 kHz,  编码器输入 : 单声道、立体声和多声道声音。  最多可支持 : 48个主声道、 16个低频音效通道 LFE (low frequency effects)、 16个配音声道 (也称为多语言声道 ) 和16个数据流。  在压缩比为 11:1(即每个声道数据率为 16/11 = 64kbps), 5声道的总码率为 320 kbps的情况下,重建声音与原始声音之间几乎无区别。  音质相同时,码率仅 MP2的 50%, MP3的 70% 2020/11/17 南京大学多媒体研究所 43 MPEG2 AAC 的特点  比 MP3更加灵活 , 如:  取样频率和码率的范围更大 ,  声道数目更多 ,  具有多语言能力 , 支持 16个嵌入数据流等,  编码器 /解码器的结构是模块化的  AAC使用了更加先进的算法及工具 , 如:  分辨率更精细的滤波器组 ,  时域噪音定形( temporal noise shaping, TNS) ,  反向自适应线性预测 (backward adaptive linear prediction),  联合立体声编码技术( joint stereo coding techniques)  改进的 Huffman coding, 2020/11/17 南京大学多媒体研究所 44 MPEG2 AAC编码器 输入信号 138187声音数据流 过去帧的量化频谱 迭代环 2020/11/17 南京大学多媒体研究所 45 由多相正交滤波器、增益检测器和增益修正器组成。 它把输入信号分离到4个相等带宽的频带中,通过忽略高频带信号而获得低取样率的输出信号,从而达到 取样频率 可调的目的。 输入信号 138187声音数据流 迭代环 过去帧的量化频谱 2020/11/17 南京大学多媒体研究所 46 把输入信号从时域变换到频域,采用了改进的离散余弦变换 MDCT,它是一种线性正交交迭变换,使用了一种称为时域去混迭技术 . 输入信号 138187声音数据流 迭代环 过去帧的量化频谱 2020/11/17 南京大学多媒体研究所 47 用来控制量化噪声,以解决掩蔽阈值和量化噪声的错误匹配问题。 输入信号 138187声音数据流 迭代环 过去帧的量化频谱 2020/11/17 南京大学多媒体研究所 48 联合立体声编码 , 目的是为了去掉声道之间的冗余信息。 包含两种空间编码技术: M/S编码(Mid/Side encoding)和声强 /耦合 (Intensity /Coupling)。 输入信号 138187声音数据流 迭代环 过去帧的量化频谱 2020/11/17 南京大学多媒体研究所 49 主要用来减少平稳(stationary)声音信号的冗余度。 输入信号 138187声音数据流 迭代环 过去帧的量化频谱 对被量化的谱系数、比例因子和方向信息进行霍夫曼编码。 2020/11/17 南京大学多媒体研究所 50 MPEG2 AAC 解码器 2020/11/17 南京大学多媒体研究所 51 MPEG2 AAC编码器的分类 (档 ) (1) Main Profile, 除了 “ 增益控制 ” 之外 , 使用了图中的所有模块 , 能提供最好的声音质量 , 对存储容量和处理能力方面的要求比较高。 (2) LC Profile( Low Complexity Profile ) , 不使用预测模块和预处理模块 , 时域噪声定形 (TNS)滤波器的级数也有限 , 声音质量比 Main Profile质量低 , 但对存储容量和处理能力的要求可明显降低。 (3) SSR Profile( Scalable Sampling Rate Profile ) , 使用增益控制对信号作预处理 , 不使用预测模块 , TNS滤波器的级数和带宽也都有限制 , 因此它比基本配置和低复杂性配置更简单 ,能用来支持可调整的取样频率。 4 MPEG4的通用声音编码 (General Audio Coding, GAC) 2020/11/17 南京大学多媒体研究所 53 MPEG4 的声音编码 ( 1) 自然音频信号的编码 (2kb/s到 64kb/s码率 )  语音信号的编码  全频带声音的编码 ( 通用声音编码 GAC) ( 2)合成音频信号的编码  结构化音频 (包括乐器数字接口 MIDI)  文语转换( TTS)  还包括一些用来增强音频合成效。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。