第3章声音3

第3章声音3内容摘要：

unhofer协会 Coding Technologies公司在 2020年 6月联合推出了 MP3格式的升级版本Mp3PRO。用 Mp3PRO压缩后的 MP3文件只有原来的一半 ,音质比原先的还好 . 2020/11/17 南京大学多媒体研究所 36 3 MPEG2音频 (1) MPEG2 Audio(ISO/IEC 138183)，或者称为MPEG2 多通道 (Multichannel) 声音，又称为MPEG2 BC (Backward Compatible)。 (2) MPEG2 AAC (ISO/IEC 138187, Advanced Audio Coding)，也称为 MPEG2 NBC(NonBackwardCompatible)标准。 MPEG2 Audio(138183) 2020/11/17 南京大学多媒体研究所 38 MPEG2 Audio对 MPEG1的扩充  增加了 16 kHz, kHz和 24 kHz采样频率声音的处理，  扩展了编码器的输出速率范围，由 32~384 kbps扩展到8~640 kbps，  增加了声道数，支持。 MPEG2 音频编码器 16, , 24, 32, , 48kHz 8~640 kbps 2020/11/17 南京大学多媒体研究所 39 MPEG2的环绕立体声 MPEG2 Audio的 “ ” 也称为 “ 3/2立体声加LFE”，放音现场前方有 3个喇叭 (左、中、右 3个声道 )，后面有 2个喇叭 (2个环绕声道 )， “ .1”指 LFE(low frequency effects)，即低频音效加强声道。 2020/11/17 南京大学多媒体研究所 40 MPEG Audio的应用  优点 :  声音品质优良  码率范围较宽  多种不同配置  四大应用领域 :  广播 ,  存储 ,  多媒体  通讯 MPEG2 AAC (Advanced Audio Coding) （ ISO/IEC 138187 ） 2020/11/17 南京大学多媒体研究所 42 MPEG2 AAC的性能  取样频率 : 从 8 kHz到 96 kHz，  编码器输入 : 单声道、立体声和多声道声音。  最多可支持 : 48个主声道、 16个低频音效通道 LFE (low frequency effects)、 16个配音声道 (也称为多语言声道 ) 和16个数据流。  在压缩比为 11:1(即每个声道数据率为 16/11 = 64kbps)， 5声道的总码率为 320 kbps的情况下，重建声音与原始声音之间几乎无区别。  音质相同时，码率仅 MP2的 50%, MP3的 70% 2020/11/17 南京大学多媒体研究所 43 MPEG2 AAC 的特点  比 MP3更加灵活 , 如：  取样频率和码率的范围更大 ,  声道数目更多 ,  具有多语言能力 , 支持 16个嵌入数据流等，  编码器 /解码器的结构是模块化的  AAC使用了更加先进的算法及工具 , 如：  分辨率更精细的滤波器组 ,  时域噪音定形（ temporal noise shaping， TNS） ,  反向自适应线性预测 (backward adaptive linear prediction),  联合立体声编码技术（ joint stereo coding techniques）  改进的 Huffman coding, 2020/11/17 南京大学多媒体研究所 44 MPEG2 AAC编码器输入信号 138187声音数据流过去帧的量化频谱迭代环 2020/11/17 南京大学多媒体研究所 45 由多相正交滤波器、增益检测器和增益修正器组成。它把输入信号分离到4个相等带宽的频带中，通过忽略高频带信号而获得低取样率的输出信号，从而达到取样频率可调的目的。输入信号 138187声音数据流迭代环过去帧的量化频谱 2020/11/17 南京大学多媒体研究所 46 把输入信号从时域变换到频域，采用了改进的离散余弦变换 MDCT，它是一种线性正交交迭变换，使用了一种称为时域去混迭技术 . 输入信号 138187声音数据流迭代环过去帧的量化频谱 2020/11/17 南京大学多媒体研究所 47 用来控制量化噪声，以解决掩蔽阈值和量化噪声的错误匹配问题。输入信号 138187声音数据流迭代环过去帧的量化频谱 2020/11/17 南京大学多媒体研究所 48 联合立体声编码 , 目的是为了去掉声道之间的冗余信息。包含两种空间编码技术： M/S编码(Mid/Side encoding)和声强 /耦合 (Intensity /Coupling)。输入信号 138187声音数据流迭代环过去帧的量化频谱 2020/11/17 南京大学多媒体研究所 49 主要用来减少平稳(stationary)声音信号的冗余度。输入信号 138187声音数据流迭代环过去帧的量化频谱对被量化的谱系数、比例因子和方向信息进行霍夫曼编码。 2020/11/17 南京大学多媒体研究所 50 MPEG2 AAC 解码器 2020/11/17 南京大学多媒体研究所 51 MPEG2 AAC编码器的分类 (档 ) (1) Main Profile，除了 “ 增益控制 ” 之外，使用了图中的所有模块，能提供最好的声音质量，对存储容量和处理能力方面的要求比较高。 (2) LC Profile（ Low Complexity Profile ），不使用预测模块和预处理模块，时域噪声定形 (TNS)滤波器的级数也有限，声音质量比 Main Profile质量低，但对存储容量和处理能力的要求可明显降低。 (3) SSR Profile（ Scalable Sampling Rate Profile ），使用增益控制对信号作预处理，不使用预测模块， TNS滤波器的级数和带宽也都有限制，因此它比基本配置和低复杂性配置更简单，能用来支持可调整的取样频率。 4 MPEG4的通用声音编码 (General Audio Coding, GAC) 2020/11/17 南京大学多媒体研究所 53 MPEG4 的声音编码（ 1）自然音频信号的编码 (2kb/s到 64kb/s码率 )  语音信号的编码  全频带声音的编码（通用声音编码 GAC）（ 2）合成音频信号的编码  结构化音频 (包括乐器数字接口 MIDI)  文语转换（ TTS）  还包括一些用来增强音频合成效。

阅读剩余 0%

本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体)，仅供学习参考。用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权，请联系我们反馈本站将在三个工作日内改正。

标签：声音

相关推荐

密码登录

账号注册