mp3解码器毕业论文(编辑修改稿)内容摘要:

衡的一个范围。 1. MP3 是一个数据压缩格式。 2. 它丢弃掉脉冲编码调制音频数据中对人类听觉不重要的数据,从而达到了 小得多的文件大小。 3. MP3 音频可以按照不同的位速进行压缩,提供了在数据大小和声音质量之间进行权衡的一个范围。 MP3 格式使用了混合的转换机制将时域信号转换成频域信号。 4. 32 波段多相积分滤波器( PQF)。 5. 36 或者 12 tap 改良离散余弦滤波器( MDCT);每个子波段大小可以在 0...1和 2...31 之间独立选择。 不仅有广泛的用户端软件支持,也有很多的硬件支持比如便携式媒体播放器(指 MP3 播放器) DVD 和 CD 播放器。 MP3 的音频质量 MP3 提供了多种不同 “ 位速 ” 的选项用来表示每 秒音频所需的编码数据位数 , 典型的速度介于每秒 128 和 320kb 之间。 与 之相对 的是 在 CD 上未经压缩的音频位速是 kbit/s。 通常较低位速编码的 MP3 文件 的 回放质量较低。 “ 压缩噪声 ” (原始录音毕业论文 6 中没有的声音)将会在回放 那些 使用过低的位速 的 MP3 文件中 出现。 它的急剧变化和随机性 使得 编码器的错误 将 会更明显。 MP3 文件的质量与编码器的质量 和 编码信号的难度有关。 听力测试显示经过简单的练习测试听众能够可靠地区分出 128kbit/s MP3 与原始 CD 的区别 ,所以 在许多情况下他们 觉得 MP3 的 音质太 差 是不可接 受的。 然而其他一些听众他们又认为音质是可接受的 ,特别是 换个环境(如在嘈杂的 公共场所 中或者聚会上)。 MP3 编码的 弊端 在低端计算机的扬声器上 相对 不 太 明显, 然 而在高质量立体声系统, 特别 是 在 使用高质量的 headphone 时 就会 比较明显。 Fraunhofer Gesellschaft 在官方网站上公布了 MPEG1 Layer 2 和 3的数据速率和压缩率用于比较: ⊙ Layer 1: 384 kbit/s,压缩率 4:1 ⊙ Layer 2: 192...256 kbit/s,压缩率 8:1...6:1 ⊙ Layer 3: 112...128 kbit/s,压缩率 12:1...10:1 不同层面之间的差别是因为它们使用了不同的心理声学模型导致的。 因为Layer 1 的算法相当简单 , 所以透明编码就需要更高的位速 , 由于不同的编码器使用不同的模型, 所以 很难进行这样的完全比较。 位速 : MP3 文件 的位速 是可变的 , 位速越高则声音文件中包含的原始声音信息越多。 位数越高 回放时声音质量也越高。 MPEG1 Layer 3 允许使用的位速是 3 4 5 6 80、 9 1112 160、 19 22 256 和 320 kbit/s。 MPEG1 Layer 3 允许的采样频率是3 和 48kHz,其中 (与 CD 的采样速率相同)是最为经常使用的采用频率。 128kbit/s 是 “ 高质量 ” 音频 的标准, 虽然 192kbit/s 在共享网络上越来越受到欢迎。 将 MP3 文件中音频切分成有不同位速的帧,在编码文件的时候就可以动态的 改变位速 ,使得 可变位速( VBR)也是可能的。 虽然 在最初的实现中并没有这项功能, 但是 现在 VBR 已经广泛的应用 , 这项技术使得在声音变化小的部分使用较小的位速而在声音变化大的部分使用较大的位 速成为可能 [2]。 毕业论文 7 MP3 音频编码 MPEG1 标准中没有 MP3 编码器的一个精确规范,人们设计适合去除原始音频中部分信息的算法 来实现 编码。 在编码过程中, 576 个时域样本被转换成 576个频域样本。 如果是瞬变信号就使用 192 而不是 576 个采样点,这是限制量化噪声随着随瞬变信号短暂扩散 [11]。 这样带来的结果就是出现了许多不同的 MP3 编码器。 每种编码器 生成的声音质量都不相同。 需 要记住的是 那些 高位速编码表现优秀的编码器未必在低位速的表现也同样好。 MPEG— llayerⅢ压缩编码算法是 ISO 于九十年代初对于音频压缩、视频压缩及等等数据流的同步和复合提出的国际标准 [13]。 在音频压缩方面,它充分利用人耳的听觉特性,以 12: 1 的比率减少原 CD 数据采样数据量。 该技术特别适用于低传输速率下高保真音频数据的传送。 因而此技术在因特网上得以流行并且在广播系统和数字音频中得到了广泛应用。 MPEG1 layer III 编码过程如图: 毕业论文 8 图 MPEG1 layer III 编码过程框图 MP3 音频解码 不同于 MP3 编码, MP3 的 解码在标准中进行了细致的定义。 多数解码器是 bitstream pliant,也就是说 MP3 文件解码出来的非压缩输出信号将与标准文档中数学定义的输出信号一模一样(在规定的近似误差范围内) [6]。 MP3 文件有一个标准的格式。 这个格式就是包括 38 57 1152 个采样点的帧,并且所有的帧都有关联的头信息和辅助信息 , 头 信息 和辅助信息能够帮助解码器正确地解码相关的霍夫曼编码数据。 所以大多数的 解码器比较几乎是完全基于它们的计算效率。 例如 : 它们在解码过程中所需要的内存或者 CPU 时间。  Mp3 解码过程了解 Mp3 的解码总体上可分为 9 个过程:比特流分解,霍夫曼解码,逆量化处理,立体声处理,频谱重排列,抗锯齿处理, IMDCT 变换,子带合成, pcm 输出[1]。 简要描述 mp3 的压缩流程。 声音是一个模拟信号,对声音进行采样,量化,编码将得到 PCM 数据, PCM 又称为脉冲编码调制数据,是电脑可以播放的最原始时域 频域映射(子带滤波器组) 数字音频信号 M D C T 非线性量化和编 码 帧数据流格式化 输出码流 辅助数据 生理声学模型 FF 样点 毕业论文 9 的数据,也是 MP3 压缩的源 [1]。 为了达到更大的数据压缩率, MPEG 标准采用子带编码技术将 PCM 数据分成 32 个子带,每个子带都是独立编码的,然后将数据变换到频域下分析, MPEG 采用的是改进的离散余弦变换,也可以使用傅利叶变换,再下来为了重建立体声进行了频谱按特定规则的排列,随后立体声处理,处理后的数据按照协议定义进行量化,为了达到更大的压缩,再进行霍夫曼编码。 最后将一些系数与主信息融合形成 mp3 文件。  解码是编码的反过程,大概如下: 所谓比特流分解是指将 mp3 文件以二进制方式打开,然后根据其压缩格式的定义,依次从这个 mp3 文件中取出头信息,边信息,比例因子信息等。 这些信息都是后面的解码过程中需要的 [8]。 霍 夫曼编码是一种无损压缩编码,属于熵编码。 逆量化处理只是几个公式的操作,代码理解中不难 立体声处理:这部分的处理也只是对几个公式的操作,代码理解不难,但原理上理解有些难度(参考:了解下面的部分可以较好地理解代码中的立体声处理函数 Joint Stereo 是一种立体声编码技巧,主要分为 Intensity Stereo(IS)和 Mid/Side (M/S) stereo 两种。 IS 的是在比较低流量时使用,利用了人耳对于低频讯号指向性分辨能力的不足,将音讯资料中的低频分解出来合成单声道资料,剩余的高频资料 则合成另一个单声道资料,并另外纪录高频资料的位置资讯,来重建立体声的效果。 例如钢琴独奏的录音就可以利用这种方法在有限的资料流量中减少音场资讯却大幅增加音色资讯。 Mid/Side (M/S) stereo 在左右声道资料相似度大时常被用到,纪录方式是将左右声道音讯合并 (L+R) 得到新的一轨,再将左右声道音讯相减 (LR) 得到 另外一轨,然后再将这两轨资料用上面提到听觉心理学模型与滤波器处理。 Mid/Side (M/S) stereo 与 IS 一样的是利用部分相位 (phase) 资讯的损失来换得较 高的音色纪录资讯。 一般的 MP3 是 Mid/Side stereo 和 Intensity Stereo 交替使用的) [10]。 频谱重排列,抗锯齿处理, IMDCT 变换,子带合成:这 4 个过程都是对若干公式的操作代码易懂,至于为什么要用这些公式,估计需要对 MPEG 编码有个了解才行。 PCM 的输出是与 c 语言对文件的处理相关的。 毕业论文 10 综上,对代码的集中在前两个环节,一是比特流分解,二是霍夫曼解码。 MP3 的利弊  优点 : MP3 的优点有许多,主要有三点:一是全部是电子元件,所以不存在防震问题,更加适合运动时欣赏音乐; 二是由于大大压缩了文件的 大小 ,所以能存储更多的信息 ,方便文件的传输与存储 ;三是可以随心所欲编辑自己喜爱的歌。  缺点 : MP3 音频压缩技术是一种 有损 压缩,因为人耳只能听到一定频段内的声音。 而 MP3 技术就把其他更高或更低频率对人耳是没有用处的声音去掉了,从而使得文件体积大为缩小。 虽然听上去 MP3 音乐仍旧具有接近 CD 的音质,但毕竟要比 CD 稍逊一些。 小结 本章主要介绍了 MP3 编解码方面的基本常识。 发展历程以及在嵌入式的应用。 MP3 是现在非常流行的一种音频编解码的方式, 是当今较流行的一种数字 音频 编码 和 有损压缩 格式,它设计用来大幅度地降低音频数据量 ,广泛的应用于网络等方面。 毕业论文 11 第三章 STM32 STM32 系列简介 STM32 系列专为高性能、低成本、低功耗的嵌入式应用 而 专门设计的 ARM CortexM3 内核。 STM32 系列 按性能分成两个不同的系列: STM32F101“ 基本型 ” 系列和 STM32F103“ 增强型 ” 系列。 时钟频率达到 72MHz 的 增强型系列是同类产品中性能最高的产品。 时钟频率为 36MHz 基本型 系列 以 16 位产品的价格得到比 16 位产品大幅提升的性能,是 16 位产品用户的最佳选择。 STM32 系列都内置 了 32K 到 128K 的闪存,不同的是 SRAM 的最大容量和外设接口的组合。 当 时钟频率 72MHz 时,从闪存执行代码, STM32 功耗 36mA,相当于 ,是 32 位市场上功耗最低的产品。 STM32 系列将为业界带来 : 1. ARM 公司的高性能 ”Cortex M3” 内核 : ,而 ARM7TDMI 只有。 2. 一流的外设 : 1μs 的双 12 位 ADC, 4 兆位 /秒的 UART, 18 兆位 /秒的 SPI, 18MHz 的 I/O 翻转速度。 3. 低功耗 : 在 72MHz 时消耗 36mA(所有外设处于工作状态 ),待机时下降到 2μA。 4. 最大的集成度 : 复位电路、低电压检测、调压器、精确的 RC 振 荡器等。 5. 简单的结构和易用的工具。 全新 STM32 互连型系列微控制器增加 了 一个全速 USB 接口,使终端产品在连接另一个 USB 设备时既可以充当 USB 主机又可充当 USB 从机 ,并且 还增加一个硬件支持IEEE1588 精确时间协议的以太网接口,可降低 CPU 开销,提高实时应用和联网设备同步通信的响应速度。 STM32 互连型系列强化了音频性能, 为了 实现音频级别的 I2S 通信 而 采用一个先进的锁相环机制。 结合 USB 主机或从机功能, STM32 可以从外部存储器读取、解码和输出音频信号。 毕业论文 12 新系列产品整合标准的 STM32 外设(包 括一个 PWM 定时器),先进的面向连接的外设,高性能的 32 位 ARM CortexM3 CPU。 这些特性使开发人员可以在设备上整合多种功能。 如 : 设备互连功能、马达控制和用户界面控制。 在 音频功能方面,新系列微控制器提供两个 I2S 音频接口,支持主机和从机两。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。