基于幅度调制的语音信号合成课程设计说明书(编辑修改稿)内容摘要:
于对包络的概念理解不清 ,也走了不少弯路,不过也取得了一些意外的效果。 在数学与信号处理的领域中,一个实值函数的希尔伯特变换是将信号 s(t)与1/(π t)做卷积,以得到 s39。 (t)。 因此,希尔伯特变换结果 s39。 (t)可以被解读为输入是 s( t)的线性时不变系统的输出,而此系统的脉冲响应为 1/(π t)。 这是一项有用的数学工具,用在描述一个以实数值载波做调制的信号之复数包络,出现在通讯理论中发挥着重要作用。 希尔伯特变换的数学表达式: s39。 (t)=H(s)= s(n)h(tn)dn=(1/π ))(s(n)/(tn))dn 其中 h( t) =1/(π t) Hilbert 变换具有两个性质: 性质 1 序列 x(n)通过 Hilbert 变换器后,信号频谱的幅度不发生变化,这是因为 Hilbert 变换器是全通滤波器,引起频谱变化的只是其相位。 性质 2 序列 x(n 与其 Hilbert 变换是正交的。 MATLAB 提供了计算 Hilbert 变换的函数,其格式为 y=Hilbert(x)。 但需注意的是,该函数计算出的结果是序列的解析信号,其虚部才是序列的 Hilbert 变换。 我们首先对采集到的语音信号进行 预 处理,截取片段,滤除其中的噪声。 对采集语音信号分析其频谱后,发现 其含有一定的高频噪声,因此决定设计一个低山东科技大学课程设计 12 通滤波器对其进行滤波。 设计的低通滤波器 (设计为子程序) 如下: 对采集到的信号选取的参数为:通带频率: 400Hz。 阻带频率: 420Hz。 试听有较好的效果。 处理过程及结果如下: 0 1 2 3 4 5 6 7 8 9x 1 04101原始信号0 100 200 300 400 500 600 700 800 900 10000500原始信号的频谱0 1 2 3 4 5 6 7 8 9x 1 04 0 . 200 . 2低通滤除噪声后的信号0 100 200 300 400 500 600 700 800 900 10000500低通滤除噪声后的频谱 其次 我们对信号进行分帧处理。 由于语音信号的 短时 平稳特性,可以将平稳过程的处理方法和理论引入到语音信号的短时处理中,将语音信号划分为很多短山东科技大学课程设计 13 时的语音段,每个短时的语音段称为一个分析帧。 这样,对一帧语音信号进行处理就相当于对特征固定的持续信号进行处理。 在处理时,按帧取数据,处理完后再取下一帧。 前一帧和后一帧的交叠部分称为帧移。 帧移与帧长的比值一般取为~。 设计的 分帧算法如下,考虑到调试方便特设计为子函数的形式,方便调用调试: 然后我们就可以按帧对信号进行处理,通过不断的尝试调试,最终发现 最优的 处理方法 为: 每 一帧进行加窗处理( Hanning 窗 ) ; 对每一帧 进行希尔伯特变换 ; 帧合并 ; 从中抽取出处理后的语音信号。 至此,男声语音包络提取完毕。 波形图如下: 0 1 2 3 4 5 6 7 8 9x 1 04 0 . 2 0 . 100 . 10 . 2纯语音波形0 200 400 600 800 1000 1200 0 . 2 0 . 100 . 10 . 2对纯语音分帧看结果 山东科技大学课程设计 14 0 50 100 150 200 250 30000 . 51窗函数0 50 100 150 200 250 30000 . 51对每帧加窗看结果0 50 100 150 200 250 30002040窗的幅度0 50 100 150 200 250 300505窗的相位 0 1 2 3 4 5 6 7 8 9x 1 04 0 . 2 0 . 100 . 10 . 2纯语音波形0 1 2 3 4 5 6 7 8 9x 1 0410123分帧处理后的包络 山东科技大学课程设计 15 女声处理 对于女声,我们主要想提取其音色 及频率 , 然后 用其与男声的包络进行幅度调制。 但是最终的提取效果 总是 不是太好,尝试了很多种办法, 都不能达到理想的效果。 因此最终 决定直接用女声信号来调制男声信号, 发现 总体能取得较能接受的效果。 虽然效果不佳,但是在 整个 过程中收货颇多。 下面将所进行的尝试过程列写下来,总结原因,希望以后有机会还能再进一步进行优化处理。 首先分 析人的发音特性。 众所周知,一切物体发声的原理都是振动出声 , 由空气传出,那在物体振动的时候出来的频率都是一个波形,这个波总可以分解为一系列不同频率正弦波的叠加,含一个基波和许多谐波,即内含各种频率成分,音色的不同,就是这些谐波的含量都不相同。 因此我们可以根据这个特性来提取这些谐波成分,然后加到男声包络上,可能会有不错的结果。 0 200 400 600 800 1000 1200 1400 1600 1800 2020 0 . 500 . 51一帧的图像0 50 100 150 200 250 300 350 400020406080100分帧后一帧的频谱 通过上面这两张图片可以看出短时内的基波谐波分布,并呈现出周期特性。 并可以看到短时内声音主要频率都是集中分布的,因此我们可以用一个带阻滤波器来把“基波”滤除掉,然后依次把得到的“谐波 ”加到包络上。 方法如下: 设计的带阻滤波器子函数: 山东科技大学课程设计 16 0 100 200 300 400 500 600 700 800 900 1000 3 0 0 2 5 0 2 0 0 1 5 0 1 0 0 5 00所设计滤波器的通带曲线 处理前声音特效: 0 1 2 3 4 5 6 7 8 9x 1 04 0 . 4 0 . 200 . 20 . 4女声片段0 200 400 600 800 1000 1200 1400 1600 1800 20200200400600女声片段频率特性 山东科技大学课程设计 17 处理后声音特效: 0 1 2 3 4 5 6 7 8 9x 1 04 0 . 2 0 . 100 . 10 . 2处理后女声片段。基于幅度调制的语音信号合成课程设计说明书(编辑修改稿)
相关推荐
线地分发多媒体内容以及大规模的广播服务。 数字水印用于隐藏标识时,可在医学、制图、数字成像、数字图像监控、多媒体索引和基于内容的检索等领域得到应用。 数字水印的认证方面主要 ID 卡、信用卡、 ATM 卡等上面数字水印的安全不可见通信 将在国防和情报部门得到广泛的应用。 多媒体技术的飞速发展和 Inter信科专业 实践报告 第 10 页 共 25 页 的普及带来了一系列政治、经济、军事和文化问题
据的融合以及相关数据的计算,基于计算所得的规则智能医疗软件设计。 第五章:主要介绍了模糊控制算法简析,模糊控制算法对用户的需治疗程度的分类,基于所得规则的监控软件的设 计,两端数据库的编写。 第六章:主要介绍了 TCP/IP 协议族的相关内容,基于 Socket 的客户端及服务器端的程序设计。 第七章:对本课题的总结及对研究课题的发展预期。 本章小结 本章作为论文的绪论部分
M8952AC25P 与 TC35 之间通过异步串行接口进行通信,通信速率为 9600b/ s,具有1位起始位、 8位数据位、 1 位停止位,无奇偶校验。 由于 TC35 的数据接口工作在 CMOS电平 ,接口电平为 ~ ,而 SM8952AC25P 单片机串口工作在 TTL电平,工作电压范围一般比 TC35宽,故应在 SM8952AC25P和 TC35之间加电平转换电路和电平限制电路。
d t k m n l Z ( 318) 而且,每个 2()f L R 都能写成: ,( ) ( )k n k nknf t d t ( 319) 13 上面的定理中,对 2, ( )f g L R , , ( ) ( )f g f t g t dt 表示空间 2()LR的内积,而()gt表示函数的复共轭。 在式( 319)中
系统功能的、运行在一个完全 隔离 环境中的完整 计算机系统。 虚拟系 统通过生成现有 操作系统 的全新虚拟 镜像 ,它具有真实 windows 系统完全一样的功能,进入虚拟系统后,所有操作都是在这个全新的 独立的虚拟系统里面进行,可以独立安装运行 软件 ,保存数据,拥有自己的独立桌面,不会对真正的系统产生任何影响 ,而且具有能够在现有系统与虚拟镜像之间灵活切换的一类操作 系统。 虚拟系统和传统的
匹配上 AndroidSDK 进行软件的开发。 JDK 简介 JDK(Java Development Kit)是一个写 Java 应用 程序 的程序开发环境。 它由一个处于 操作系统 层之上的运行环境还有开发者编译,调试和运行用 Java 语言写的applet 和应用程序所需的工具组成。 JDK 是 Sun Microsystems 针对 Java 开发员的产品。 自从 Java 推出以来,