第3章声音3内容摘要:
unhofer协会 Coding Technologies公司在 2020年 6月联合推出了 MP3格式的升级版本Mp3PRO。 用 Mp3PRO压缩后的 MP3文件只有原来的一半 ,音质比原先的还好 . 2020/11/17 南京大学多媒体研究所 36 3 MPEG2音频 (1) MPEG2 Audio(ISO/IEC 138183), 或者称为MPEG2 多 通道 (Multichannel) 声音 , 又称为MPEG2 BC (Backward Compatible)。 (2) MPEG2 AAC (ISO/IEC 138187, Advanced Audio Coding), 也称为 MPEG2 NBC(NonBackwardCompatible)标准。 MPEG2 Audio(138183) 2020/11/17 南京大学多媒体研究所 38 MPEG2 Audio对 MPEG1的扩充 增加了 16 kHz, kHz和 24 kHz采样频率声音的处理 , 扩展了编码器的输出速率范围 , 由 32~384 kbps扩展到8~640 kbps, 增加了声道数 , 支持。 MPEG2 音频编码器 16, , 24, 32, , 48kHz 8~640 kbps 2020/11/17 南京大学多媒体研究所 39 MPEG2的环绕立体声 MPEG2 Audio的 “ ” 也称为 “ 3/2立体声加LFE”, 放音现场前方有 3个喇叭 (左 、 中 、 右 3个声道 ), 后面有 2个喇叭 (2个环绕声道 ), “ .1”指 LFE(low frequency effects), 即低频音效加强声道。 2020/11/17 南京大学多媒体研究所 40 MPEG Audio的应用 优点 : 声音品质优良 码率范围较宽 多种不同配置 四 大应用领域 : 广播 , 存储 , 多媒体 通讯 MPEG2 AAC (Advanced Audio Coding) ( ISO/IEC 138187 ) 2020/11/17 南京大学多媒体研究所 42 MPEG2 AAC的性能 取样频率 : 从 8 kHz到 96 kHz, 编码器输入 : 单声道、立体声和多声道声音。 最多可支持 : 48个主声道、 16个低频音效通道 LFE (low frequency effects)、 16个配音声道 (也称为多语言声道 ) 和16个数据流。 在压缩比为 11:1(即每个声道数据率为 16/11 = 64kbps), 5声道的总码率为 320 kbps的情况下,重建声音与原始声音之间几乎无区别。 音质相同时,码率仅 MP2的 50%, MP3的 70% 2020/11/17 南京大学多媒体研究所 43 MPEG2 AAC 的特点 比 MP3更加灵活 , 如: 取样频率和码率的范围更大 , 声道数目更多 , 具有多语言能力 , 支持 16个嵌入数据流等, 编码器 /解码器的结构是模块化的 AAC使用了更加先进的算法及工具 , 如: 分辨率更精细的滤波器组 , 时域噪音定形( temporal noise shaping, TNS) , 反向自适应线性预测 (backward adaptive linear prediction), 联合立体声编码技术( joint stereo coding techniques) 改进的 Huffman coding, 2020/11/17 南京大学多媒体研究所 44 MPEG2 AAC编码器 输入信号 138187声音数据流 过去帧的量化频谱 迭代环 2020/11/17 南京大学多媒体研究所 45 由多相正交滤波器、增益检测器和增益修正器组成。 它把输入信号分离到4个相等带宽的频带中,通过忽略高频带信号而获得低取样率的输出信号,从而达到 取样频率 可调的目的。 输入信号 138187声音数据流 迭代环 过去帧的量化频谱 2020/11/17 南京大学多媒体研究所 46 把输入信号从时域变换到频域,采用了改进的离散余弦变换 MDCT,它是一种线性正交交迭变换,使用了一种称为时域去混迭技术 . 输入信号 138187声音数据流 迭代环 过去帧的量化频谱 2020/11/17 南京大学多媒体研究所 47 用来控制量化噪声,以解决掩蔽阈值和量化噪声的错误匹配问题。 输入信号 138187声音数据流 迭代环 过去帧的量化频谱 2020/11/17 南京大学多媒体研究所 48 联合立体声编码 , 目的是为了去掉声道之间的冗余信息。 包含两种空间编码技术: M/S编码(Mid/Side encoding)和声强 /耦合 (Intensity /Coupling)。 输入信号 138187声音数据流 迭代环 过去帧的量化频谱 2020/11/17 南京大学多媒体研究所 49 主要用来减少平稳(stationary)声音信号的冗余度。 输入信号 138187声音数据流 迭代环 过去帧的量化频谱 对被量化的谱系数、比例因子和方向信息进行霍夫曼编码。 2020/11/17 南京大学多媒体研究所 50 MPEG2 AAC 解码器 2020/11/17 南京大学多媒体研究所 51 MPEG2 AAC编码器的分类 (档 ) (1) Main Profile, 除了 “ 增益控制 ” 之外 , 使用了图中的所有模块 , 能提供最好的声音质量 , 对存储容量和处理能力方面的要求比较高。 (2) LC Profile( Low Complexity Profile ) , 不使用预测模块和预处理模块 , 时域噪声定形 (TNS)滤波器的级数也有限 , 声音质量比 Main Profile质量低 , 但对存储容量和处理能力的要求可明显降低。 (3) SSR Profile( Scalable Sampling Rate Profile ) , 使用增益控制对信号作预处理 , 不使用预测模块 , TNS滤波器的级数和带宽也都有限制 , 因此它比基本配置和低复杂性配置更简单 ,能用来支持可调整的取样频率。 4 MPEG4的通用声音编码 (General Audio Coding, GAC) 2020/11/17 南京大学多媒体研究所 53 MPEG4 的声音编码 ( 1) 自然音频信号的编码 (2kb/s到 64kb/s码率 ) 语音信号的编码 全频带声音的编码 ( 通用声音编码 GAC) ( 2)合成音频信号的编码 结构化音频 (包括乐器数字接口 MIDI) 文语转换( TTS) 还包括一些用来增强音频合成效。第3章声音3
本资源仅提供20页预览,下载后可查看全文
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。
用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。
相关推荐
第2章数据的组织与表达
6组,组限为— ; ……。 依次把 140个观察值都进行归组,即可制成 140行水稻产量的次数分布表 (表 5)。 二、 连续性变数资料的整理 表 5 140行水稻的次数分布 组 限 中点值 ( y ) 次数 ( f ) — 75 2 — 90 7 — 105 7 — 120 13 — 135 17 — 150 20 — 165 25 — 180 21 — 195 13 — 210 9 —
第2章单片机结构及原理
H。 在片外。 读写 ROM用 MOVC指令,控制信号是 PSEN和 EA。 读 ROM是以程序计数器 PC作为 16位地址指针,依次读相应地址 ROM中的指令和数据,每读一个字节, PC+1→PC ,这是 CPU自动形成的。 但是有些指令有修改 PC的功能,例如转移类指令和 MOVC指令, CPU将按修改后 PC的 16位地址读 ROM。 读 外 ROM的过程: CPU从 PC(程序计数器
第2章微型计算机基础
同时执行更多的指令 例如, PIII为 14个阶段, P4为 20个阶段 (超级流水线 ) 38 结论 指令预取队列的存在使 EU和 BIU两个部分可同时进行工作,从而带来了以下两个好处: 提高了 CPU的效率 降低了对存储器存取速度的要求 39 8088/8086 CPU的特点 采用并行流水线工作方式 对内存空间实行分段管理: 每段大小为 16B~ 64KB