基于小波变换的语音增强算法的分析毕业设计论文(编辑修改稿)内容摘要:

3。 28 致 谢 29 参考文献 30 附 录 32 一 、 英文原文 32 二 、 英文翻译 36 三、源程序 40 重庆邮电大学移通学院本科毕业设计(论文) 1 前 言 日常生活中,经常会遇到在噪声干扰下进行语音通信的问题。 例如在汽车、火车上使用移动电话, 旁人的喧闹声,马路旁和市场里的公用电话等。 军事通信 中,指挥员的作战命令和战斗员的战情汇报都需要用语音来表达,由于 战斗环境中的声环境恶劣,特别是炸弹产生的冲击性噪声,使有用信号完全淹没在噪声中。 窃听技术中需要语音增强。 语音识别技术也需要语音增强。 语音增强不但与语音信号数字处理理论有关,而且涉及到人的听觉感知和语音学范畴。 在实际生活中,语音信号无时无地不受各种噪声干扰。 人们正常的生活环境就是一个声级为 60dB 左右的噪声环境。 被强噪声污染的场合,噪声达 120dB 以上。 噪声的来源众多,因应用场合而异,它们的特性也各不相同。 所以必须针对不同噪声,采用不同的语音增强对策。 重庆邮电大学移通学院本科毕业设计(论文) 2 第一 章 绪论 第一节 语音增强技术的发展与现状 一、 语音增强技术的意义 随着语音信号处理技术的不断发展,不论是语音编码,语音合成还是语音识别技术都在不断的发展,实际应用也越来越广泛 [1]。 这些技术在理论研究阶段都是以纯净的信号进行研究和分析的,然而在实际应用中,语音信号会不可避免的受到周围环境的影响,很多因素都会导致语音信 号受到噪声的污染,比如语音信号在传输媒介中引入的噪声,电子设备内部的电噪声,还有来自其他音源的干扰等。 这些干扰导致语音信号处理系统中使用的是非纯净的语音信号,直接使用带有噪声的语音会使系统的整体性能明显降低。 在很多语音处理系统中,为了提高系统的整体性能,需要事先对语音信号进行预处理,降低噪声对语音信号的影响。 语音增强是提高语音质量的一种有效方法,从受噪声污染的语音信号中尽量分离噪声并尽可能地还原纯净语音信号,使接受语音的人觉得语音质量得到改善,增强语音信号的可懂性,提高语音处理系统的识别率和抗干扰能力。 语 音增强技术已经发展成了数字语音信号处理的一个重要分支,广泛地应用在降低听觉噪声以及语音识别系统和线性预测编码系统的预处理部分。 图 语音增强系统结构图 重庆邮电大学移通学院本科毕业设计(论文) 3 二、 噪声的种类和特点 噪声是指人们不需要的声音,此外,杂乱的振幅和频率,断续或统计上无规律的声震动也称为噪声。 噪声来源于实际的环境中,其特性复杂,很难找到一种语音增强系统可以适应所有的噪声环境。 因此,要根据实际情况来制定相应的语音增强算法。 根据噪声对语音频谱的干扰方式不同,可以将噪声分为加性噪声和非加性噪声。 当噪声对语音的干扰表现为两者在时域上进行相加时,该噪声被称为加性噪声。 实际环境中背景噪声可以看做加性噪声。 当噪声和语音在频域上表象为相乘的关系,含噪信号表现在时域上即为噪声和语音信号的卷积。 非加性 噪声可以通过某种变换转换为加性噪声,从而用处理加性噪声的方法处理非加性噪声。 为简化讨论,本文所分析的噪声都是加性噪声。 语音处理中的加性噪声大致上有:周期性噪声、脉冲噪声、宽带噪声和同声道的其他语音干扰等。 (一)周期性噪声 周期性噪声主要来源于发动机等周期性运转的机械,电气干扰,特别是电源交流声也会引起周期性噪声,其特点是在频域上有许多离散的线谱。 可现实环境中产生的周期性噪声并非只含线谱分量,还有许多的窄谱。 而且往往是时变的,并与语音信号频谱重叠,只有用自适应滤波的方法才可以处理这类噪声。 (二)脉冲噪声 脉冲噪声来源于爆炸、撞击和放电等,表现为时域波形中突然出现的窄脉冲。 脉冲噪声不太密,一般容易用内插法来去掉这种噪声。 (三)宽带噪声 宽带噪声来源于热噪声、气流(如风、呼吸)噪声及各种随机噪声源,量化噪声也可视为宽带噪声。 平稳的宽带噪声,通常也可认为是白色高斯噪声;不具有白色频谱的噪声,也可以通过白化处理转化为白噪声。 (四)同声道语音干扰 多个语音信号在一个信道中同时传输相互干扰而产生的现象称为同声道语音干扰。 根据人耳的感知特性,一个较弱的语音信号会由于出现一个更强的语音信号而被感知阈值掩蔽,即人耳的掩蔽 效应。 然而,由于人的双耳输入效应,人耳可以根据需要分辨出其中某个人的声音,这种能力被称作“鸡尾酒会效应”。 人的主观感觉决定了语音增强的效果,因重庆邮电大学移通学院本科毕业设计(论文) 4 此,合理的利用人耳的感知特性可以在语音增强中得到更好的增强效果。 三、语音增强技术的发展 正如前面提到的,由于噪声特性各异,因此语音增强方法也不同。 在语音增强技术发展的 40多年里,国内外的学者在对加性噪声研究了各种语音增强算法。 至目前应用的方法可分为四种:参数方法、非参数方法、统计方法和其他方法。 (一)参数方法 此类方法主要依赖于使用的语音生成模型(例如 AR 模型) ,需要提取模型参数(如基因周期、 LPC 系数),常常使用迭代方法。 如果实际噪声或语音条件与模型的有较大的差距或提出模型参数有困难,这类方法容易失效。 常用的滤波器模型有梳状滤波器,维纳滤波器和卡曼滤波器等。 (二)非参数方法 因为不需要从带噪信号中估计模型参数,非参数方法应用范围广,限制少,但没有利用可能的统计信息,故结果一般不是最优。 这种方法包括:谱减法、自适应滤波等。 (三)统计方法 统计方法较多的利用了语音和噪声的统计特性,一般需要建立模型库,需要训练过程获得初始统计参数,它与语音识别系统的联系很密切。 如 最小均方误差估计( MMSE)、听觉掩蔽效应等。 在实际应用中发现,将统计方法与其他语音增强算法结合可以得到很好的降噪效果。 在小波变换和离散余弦变换中常使用来寻找合适的阈值参数,在基于听觉掩蔽效应的语音增强系统中叶经常使用统计方法来确定听觉掩蔽阈值。 在对语音信号和噪声信号进行分析时,选择合适的统计方法可以有效地确定语音和噪声的特征参数。 (四)其他方法 如小波变换、卡亨南 洛维变换( KLT)、离散余弦变换( DCT)、人工神经网络等。 利用之前的各种方法进行语音增强,需要知道噪声的有一些特征或统计性质。 在没有噪声 先验知识的情况下,从唯一带噪语音信号中分离出语音信号,这非常困难。 小波变换能将信号在多个尺度上进行小波分解,各尺度上分解所得到的小波变换系数代表信号在不同分辨率上的信息。 语音信号和噪声之间具有不同的 Lipschitz 指数,即信号具有正奇异性,而随机噪声具有负奇异性。 这种性质在小波变换中,表现为信号的变换模值随尺度的增加而增加,随机噪声的变换模值随尺度的增加而减小。 重庆邮电大学移通学院本科毕业设计(论文) 5 第 二 节 语音信号处理技术概况 语言是人类交换信息最方便,最快捷的一种方式 [2]。 在这个信息化高度发达的现代社会,数字语音信号的传送、存储、 识别、合成以及增强是现代信息网络中极为重要的组成部分。 语音信号处理与很多领域的知识体系都有非常密切的关系,是语音和数学信号处理这两个学科衍生出来的边缘学科。 随着心理学、语言学、信息论、密码学、模式识别以及人工智能等领域的不断进步以及电子技术的不断发展,数字语音信号处理也开始广泛应用于各个领域。 数字语音信号合成的主要分支。 一、 语音合成 在语音合成技术的发展中,早期的研究主要是采用参数合成方法。 但真正具有实用意义的近代语音合成技术是随着计算机技术和数字信号处理技术的发展而发展起来的,主要是采用计算机产生高清 晰度、高自然度的连续语音。 使用语音合成技术的好处是不需要事先进语音信号的录入,只需要根据建立相应的语音合成法则,将需要表达的内容在机器内部进行编码,自动地生成相应的语音信号。 相对于传统的语音播放系统,语音合成技术节省了资源空间并且提高了系统的的可扩展性。 现阶段语音合成的最大进展是已经能够实时地将任意文本 转换 成连续可懂的自然语句输出。 文语转换使得数据通信和语音通信在终端一级实现交融,人们将有望在获取 Inter信息时,使短信消息服务、电子邮件等多数以文本方式提供的信息也能用语音的方式输出。 语音合成技术经 历了从参数合成到拼接合成,再到两者的逐步结合,其不断发展的动力是人们认知水平和需求的提高。 二、 语音编码 语音编码是将机器采集来的模拟语音信号按照一定规则转化为数字信号,而最简单的方法就是对模拟信号进行 A/D 采样。 语音编码是通过减少语音信号的冗余度和利用人耳掩蔽等特性实现数据压缩, 目的就是在保证一定语音质量的前提下,尽可能降低编码的比特率,以节省频率资源。 重庆邮电大学移通学院本科毕业设计(论文) 6 三、 语音识别 语音识别就是让机器能够识别和理解人类的语言内容,从而转化成相应的文本或命令的技术。 在实际应用中,语音识别技术具有很多的优势。 比 如,在输入信息的时候,直接说出语音指令比通过键盘输入要更方便很多,在速度上也要快很多。 然而语音识别也有缺陷,它涉及的分类众多,技术难点多,环境影响大,识别率不高等等,这都是未来需要解决的难题。 第三节 课题研究的背景与意义 在语音通信过程中不可避免地会受到来自周围环境和传输媒介引入的噪声、通信设备内部电噪声乃至其他说话者的干扰。 这些干扰最终使得收听者收到的语音已经不是纯净的原始语音信号,而是受到噪声污染的带噪语音信号。 语音识别系统在背景噪声很强时,识别正确率大大下降;在低速率语音参数编码中当模型参 数受到混杂在语音信号中的背景噪声严重干扰时,重建语音质量将急剧恶化等等。 语音增强算法的研究对人的语音感知和听觉机理、听觉生理学实验的借鉴仍然是不充分的。 一方面是由于神经的复杂结构和大脑的复杂作用,使得人们对听觉机理的研究和认识尚处于非常粗浅的阶段,另一方面则是因为语音增强算法的研究人员一般来自于信号处理领域,对语音学、心理学和生理学的结果没有给予足够的重视。 所以,语音增强的研究有待于进一步的完善和发展,还具有很大的研究空间和研究价值。 第四节 课题研究的主要内容与结构 本文首先对语音信号处理和语 音增强系统的发展与现状做了详细的介绍;其次对几种常用的语音增强算法进行了介绍,接着简要的介绍了小波分析的基本原理以及在信号处理中的应用;深入分析了小波阈值降噪算法的原理,最后 利用 MATLAB 软件进行了信号降噪的模拟仿真实验。 全文结构如下: 重庆邮电大学移通学院本科毕业设计(论文) 7 第一章简要介绍了语音信号处理的概况和语音增强技术的基本概念,本文主要的研究内部和论文结构; 第二章 深入研究了几种常见的语音增强算法; 第三章 介绍了小波变换的基本概念以及多分辨小波分析的构造,并介绍了小波在信号处理中的应用; 第四章详细介绍 Matlab 软件的功能与应用,利用 Matlab 进行仿真实验。 重庆邮电大学移通学院本科毕业设计(论文) 8 第二章 几种常用的语音增强方法 第一节 自适应噪声抵消法 自适应噪声抵消法可以在未知环境中跟踪时变的语音信号 [3],通过构建自适应噪声滤波器来估计噪声,使增强后的语音信号达到最优,其原理如图 : 图 自适应噪声抵消法结构图 如图 , s(n)为纯净语音信号, d(n)为加性平稳噪声, y(n)为带噪声语音信号, r(n)为自适应滤波器的参考噪声输入, v(n)是该滤波器的输出。 自适应滤波器在输入过程中,当参考噪声发生变化时,可以自适应的调整滤波器参数,以达到最佳的语音增强效果。 自适应滤波器通过对输入 r(n)进行处理,使得输出的噪声估计 v(n)尽 量逼近噪声 d(n),从带噪声语音中减去噪声分量,从而实现语音增强的效果。 自适应滤波器通常采用 FIR 滤波器,以误差 e(n)最小为标准,滤波器系数通过最小均方误差准则迭代估计。 误差的表达式为:  Nk k knrwndnsnvndnsne 1 )()()()(。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。