基于振幅调制的语音信号合成_课程设计(编辑修改稿)内容摘要:
由于现在没有成型的小波变换模型供参考,因此本设计最终采用的是基于希尔伯特变换的包络提取。 同时在设计的过程中由于对包络的概念理解不清,也走了不少弯路,不过也取得了一些意外的效果。 在数学与信号处理的领域中,一个实值函数的希尔伯特变换是将信号 s(t)与1/(π t)做卷积,以得到 s39。 (t)。 因此,希尔伯特变换结果 s39。 (t)可以被解读为输入是 s( t)的线性时不变系统的输出,而此系统的脉冲响应为 1/(π t)。 这是一项有用的数学工具,用在描述一个以实数值载波做调制的信号之复数包络,出现在通讯理论中发 挥着重要作用。 希尔伯特变换的数学表达式: s39。 (t)=H(s)= s(n)h(tn)dn=(1/π ))(s(n)/(tn))dn 其中 h( t) =1/(π t) Hilbert 变换具有两个性质: 性质 1 序列 x(n)通过 Hilbert 变换器后,信号频谱的幅度不发生变化,这是因为 Hilbert 变换器是全通滤波器,引起频谱变化的只是其相位。 性质 2 序列 x(n 与其 Hilbert 变换是正交的。 MATLAB 提供了计算 Hilbert 变换的函数,其格式为 y=Hilbert(x)。 但需注意的是,该函数计算出的结果是序 列的解析信号,其虚部才是序列的 Hilbert 变换。 我们首先对采集到的语音信号进行 预 处理,截取片段,滤除其中的噪声。 对采集语音信号分析其频谱后,发现其含有一定的高频噪声,因此决定设计一个低山东科技大学课程设计 12 通滤波器对其进行滤波。 设计的低通滤波器 (设计为子程序) 如下: 对采集到的信号选取的参数为:通带频率: 400Hz。 阻带频率: 420Hz。 试听有较好的效果。 处理过程及结果如下: 0 1 2 3 4 5 6 7 8 9x 1 04101原始信号0 100 200 300 400 500 600 700 800 900 10000500原始信号的频谱0 1 2 3 4 5 6 7 8 9x 1 04 0 . 200 . 2低通滤除噪声后的信号0 100 200 300 400 500 600 700 800 900 10000500低通滤除噪声后的频谱 其次 我们对信号进行分帧处理。 由于语音信号的 短时 平稳特性,可以将平稳过程的处理方法和理论引入到语音信号的短时处理中,将语音信号划分为很多短山东科技大学课程设计 13 时的语音段,每个短时的语音段称为一个分析帧。 这样,对一帧语音信号进行处理就相当于对特征固定的持续信号进行处理。 在处理时,按帧取数据,处理完后再取下一帧。 前一帧和后一帧的交叠部分称为帧移。 帧移与帧长的比值一般取为~。 设计的 分帧算法如下,考虑到调试方便特设计为子函数的形式,方便调用调试: 然后我们就可以按帧对信号进行处理,通过不断的尝试调试,最终发现 最优的 处理方法 为: 每 一帧进行加窗处理( Hanning 窗 ) ; 对每一帧 进行希尔伯特变换 ; 帧合并 ; 从中抽取出处理后的语音信号。 至此,男声语音包络提取完毕。 波形图如下: 0 1 2 3 4 5 6 7 8 9x 1 04 0 . 2 0 . 100 . 10 . 2纯语音波形0 200 400 600 800 1000 1200 0 . 2 0 . 100 . 10 . 2对纯语音分帧看结果 山东科技大学课程设计 14 0 50 100 150 200 250 30000 . 51窗函数0 50 100 150 200 250 30000 . 51对每帧加窗看结果0 50 100 150 200 250 30002040窗的幅度0 50 100 150 200 250 300505窗的相位 0 1 2 3 4 5 6 7 8 9x 1 04 0 . 2 0 . 100 . 10 . 2纯语音波形0 1 2 3 4 5 6 7 8 9x 1 0410123分帧处理后的包络 山东科技大学课程设计 15 女声处理 对于女声,我们主要想提取其音色 及频率 , 然后 用其与男声的包络进行幅度调制。 但是最终的提取效果 总是 不是太好,尝试了很多种办法, 都不能达到理想的效果。 因此最终 决定直接用女声信号来调制男声信号, 发现 总体能取得较能接受的效果。 虽然效果不佳,但是在 整个 过程中收货颇多。 下面将所进行的尝试过程列写下来,总结原因,希望以后有机会还能再进一步进行优化处理。 首先分 析人的发音特性。 众所周知,一切物体发声的原理都是振动出声 , 由空气传出,那在物体振动的时候出来的频率都是一个波形,这个波总可以分解为一系列不同频率正弦波的叠加,含一个基波和许多谐波,即内含各种频率成分,音色的不同,就是这些谐波的含量都不相同。 因此我们可以根据这个特性来提取这些谐波成分,然后加到男声包络上,可能会有不错的结果。 0 200 400 600 800 1000 1200 1400 1600 1800 20xx 0 . 500 . 51一帧的图像0 50 100 150 200 250 300 350 400020406080100分帧后一帧的频谱 通过上面这两张图片可以看出短时内的基波谐波分布,并呈现出周期特性。 并可以看到短时内声音主要频率都是集中分布的,因此我们可以用一个带阻滤波器来把“基波”滤除掉,然后依次把得到的“谐波 ”加到包络上。 方法如下: 设计的带阻滤波器子函数: 山东科技大学课程设计 16 0 100 200 300 400 500 600 700 800 900 1000 3 0 0 2 5 0 2 0 0 1 5 0 1 0 0 5 00所设计滤波器的通带曲线 处理前声音特效: 0 1 2 3 4 5 6 7 8 9x 1 04 0 . 4 0 . 200 . 20 . 4女声片段0 200 400 600 800 1000 1200 1400 1600 1800 20xx0200400600女声片段频率特性 山东科技大学课程设计 17 处理后声音特效: 0 1 2 3 4 5 6 7 8 9x 1 04。基于振幅调制的语音信号合成_课程设计(编辑修改稿)
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。
用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。