第3章声音2数字语音的压缩编码内容摘要:

 空气由肺部呼出,经过声带,送入声道,最后从嘴唇呼出,产生声音。  成年男子的声道平均长度约 17cm,它使声音信号具有短期相关性 (持续时间 1 ms左右 )  声道是一个谐振腔,说话时,声道形状不断变化,引起谐振频率改变,大约10 ~ 100 ms改变一次;  声道可以看作为具有共振特性的一个滤波器,由于声道形状变化比较慢,因此该滤波器的转移函数 (transfer function)只需要每 20ms左右时间修改一次。 声道 声带 空气 语音 2020/11/4 南京大学多媒体研究所 29 语音生成过程( 2)  声道滤波器由肺部空气经过声带而激励,根据激励的模式,语音可分成 2类: 浊音(时间域) – 浊音 Voiced sounds (声带震动,产生准周期的空气脉冲激励信号,送入声道) 清音(时间域) – 清音 Unvoiced sounds(声带不振动,声门始终处于“开”状态,送入声道的空气激励信号是一种无周期性的噪音信号) 2020/11/4 南京大学多媒体研究所 30 语音生成的声道滤波器模型 (1) 2020/11/4 南京大学多媒体研究所 31 语音生成的声道滤波器模型 (2) LPC模型 = (a1, a2, a3, a4, a5, a6, a7, a8, a9, a10, G, V/UV, T) 脉冲序列发生器 随机噪声发生器 基音周期 T (声带振动 ) (声带不振动 ) UV(清音 ) V(浊音 ) H(z) 声 道 参 数 a1 a2 a3 a10 ... 语音 (声道滤波器 ) s(n) 增益 G u(n) 激励信号 2020/11/4 南京大学多媒体研究所 32  语音是一个近似的短时 (10~30ms)平稳随机过程, LPC模型的参数 A = (a1, a2, a3, a4, a5, a6, a7, a8, a9, a10, G, V/UV, T)变化比较慢 , 大约每 20ms变化一次;  假设语音信号的取样频率为 8kHz,将每秒钟分成 50帧,每帧 20ms(其中有 20x8=160个样本 ) ,每一帧的所有信号近似地满足同一模型,即每一帧语音可以使用同一组参数来表示 :  浊音还是清音( 1位)  浊音的基频 T( 6位)  音源的幅度 G( 5位)  线性滤波器的参数 ( 10个参数,每个参数 6位,共 60位) 语音的参数编码( LPC分析) —— 从已知的数字语音信号中提取参数 所以,每秒总码率为: 50 x 72 bits = 3600 bps = 2020/11/4 南京大学多媒体研究所 33 2 如何确定 LPC的系数 (1)  对声音波形的编码实际就转化为如何提取语音生成模型的参数,经典的方法是线性预测编码 LPC。  每一个样本都用过去 10个样本的线性组合来预测: spre(n) = [a1s(n1)+a2s(n2)+… +a10s(n10)]  样本 s(n)的预测误差为 : e(n) = s(n) spre(n) = s(n) + a1s(n1)+a2s(n2) +… +a10s(n10) 10个样本 s(n10) s(n2) s(n1) s(n) 2020/11/4 南京大学多媒体研究所 34 如何确定 LPC的系数 (2)  问题:对给定的一帧信号 s(n) , n=[0..159],怎样选择系数 ai 使得预测误差 e(n)的平方和为最小。 即 最小  为此,上式对 a1, a2, … , a10 分别求偏导数得到一组差分方程 dE/da1 = 0, dE/da2 = 0, … .. , dE/da10 = 0,  求解差分方程组,可得到系数 ai 的值。 E = ∑e(i)2 i=0 159 2020/11/4 南京大学多媒体研究所 35 求解系数 ai的线性方程组 R(0) R(1) R(2) R(3) R(4) R(5) R(6) R(7) R(8) R(9) a1 R(1) R(1) R(0) R(1) R(2) R(3) R(4) R(5) R(6) R(7) R(8) a2 R(2) R(2) R(1) R(0) R(1) R(2) R(3) R(4) R(5) R(6) R(7) a3 R(3) R(3) R(2) R(1) R(0) R(1) R(2) R(3) R(4) R(5) R(6) a4 R(4) R(4) R(3) R(2) R(1) R(0) R(1) R(2) R(3) R(4) R(5) a5 R(5) R(5) R(4) R(3) R(2) R(1) R(0) R(1) R(2) R(3) R(4) a6 R(6) R(6) R(5) R(4) R(3) R(2) R(1) R(0) R(1) R(2) R(3) a7 R(7) R(7) R(6) R(5) R(4) R(3) R(2) R(1) R(0) R(1) R(2) a8 R(8) R(8) R(7) R(6) R(5) R(4) R(3) R(2) R(1) R(0) R(1) a9。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。