第3章声音2数字语音的压缩编码内容摘要:
空气由肺部呼出,经过声带,送入声道,最后从嘴唇呼出,产生声音。 成年男子的声道平均长度约 17cm,它使声音信号具有短期相关性 (持续时间 1 ms左右 ) 声道是一个谐振腔,说话时,声道形状不断变化,引起谐振频率改变,大约10 ~ 100 ms改变一次; 声道可以看作为具有共振特性的一个滤波器,由于声道形状变化比较慢,因此该滤波器的转移函数 (transfer function)只需要每 20ms左右时间修改一次。 声道 声带 空气 语音 2020/11/4 南京大学多媒体研究所 29 语音生成过程( 2) 声道滤波器由肺部空气经过声带而激励,根据激励的模式,语音可分成 2类: 浊音(时间域) – 浊音 Voiced sounds (声带震动,产生准周期的空气脉冲激励信号,送入声道) 清音(时间域) – 清音 Unvoiced sounds(声带不振动,声门始终处于“开”状态,送入声道的空气激励信号是一种无周期性的噪音信号) 2020/11/4 南京大学多媒体研究所 30 语音生成的声道滤波器模型 (1) 2020/11/4 南京大学多媒体研究所 31 语音生成的声道滤波器模型 (2) LPC模型 = (a1, a2, a3, a4, a5, a6, a7, a8, a9, a10, G, V/UV, T) 脉冲序列发生器 随机噪声发生器 基音周期 T (声带振动 ) (声带不振动 ) UV(清音 ) V(浊音 ) H(z) 声 道 参 数 a1 a2 a3 a10 ... 语音 (声道滤波器 ) s(n) 增益 G u(n) 激励信号 2020/11/4 南京大学多媒体研究所 32 语音是一个近似的短时 (10~30ms)平稳随机过程, LPC模型的参数 A = (a1, a2, a3, a4, a5, a6, a7, a8, a9, a10, G, V/UV, T)变化比较慢 , 大约每 20ms变化一次; 假设语音信号的取样频率为 8kHz,将每秒钟分成 50帧,每帧 20ms(其中有 20x8=160个样本 ) ,每一帧的所有信号近似地满足同一模型,即每一帧语音可以使用同一组参数来表示 : 浊音还是清音( 1位) 浊音的基频 T( 6位) 音源的幅度 G( 5位) 线性滤波器的参数 ( 10个参数,每个参数 6位,共 60位) 语音的参数编码( LPC分析) —— 从已知的数字语音信号中提取参数 所以,每秒总码率为: 50 x 72 bits = 3600 bps = 2020/11/4 南京大学多媒体研究所 33 2 如何确定 LPC的系数 (1) 对声音波形的编码实际就转化为如何提取语音生成模型的参数,经典的方法是线性预测编码 LPC。 每一个样本都用过去 10个样本的线性组合来预测: spre(n) = [a1s(n1)+a2s(n2)+… +a10s(n10)] 样本 s(n)的预测误差为 : e(n) = s(n) spre(n) = s(n) + a1s(n1)+a2s(n2) +… +a10s(n10) 10个样本 s(n10) s(n2) s(n1) s(n) 2020/11/4 南京大学多媒体研究所 34 如何确定 LPC的系数 (2) 问题:对给定的一帧信号 s(n) , n=[0..159],怎样选择系数 ai 使得预测误差 e(n)的平方和为最小。 即 最小 为此,上式对 a1, a2, … , a10 分别求偏导数得到一组差分方程 dE/da1 = 0, dE/da2 = 0, … .. , dE/da10 = 0, 求解差分方程组,可得到系数 ai 的值。 E = ∑e(i)2 i=0 159 2020/11/4 南京大学多媒体研究所 35 求解系数 ai的线性方程组 R(0) R(1) R(2) R(3) R(4) R(5) R(6) R(7) R(8) R(9) a1 R(1) R(1) R(0) R(1) R(2) R(3) R(4) R(5) R(6) R(7) R(8) a2 R(2) R(2) R(1) R(0) R(1) R(2) R(3) R(4) R(5) R(6) R(7) a3 R(3) R(3) R(2) R(1) R(0) R(1) R(2) R(3) R(4) R(5) R(6) a4 R(4) R(4) R(3) R(2) R(1) R(0) R(1) R(2) R(3) R(4) R(5) a5 R(5) R(5) R(4) R(3) R(2) R(1) R(0) R(1) R(2) R(3) R(4) a6 R(6) R(6) R(5) R(4) R(3) R(2) R(1) R(0) R(1) R(2) R(3) a7 R(7) R(7) R(6) R(5) R(4) R(3) R(2) R(1) R(0) R(1) R(2) a8 R(8) R(8) R(7) R(6) R(5) R(4) R(3) R(2) R(1) R(0) R(1) a9。第3章声音2数字语音的压缩编码
相关推荐
确,不能含混不清,不置可否。 第三,凡请示事项或问题的解决涉及有关单位者,应事先商同有关单位,或在请示中加以说明。 第四,一定要把请示与报告区分开来,不能混用,亦不能写成“请示报告”。 批复,是上级机关根据有关的方针、政策和法规,依据自身的职权,针对下级机关的请示事项所作书面形式的答复。 第四节 批复 一、批复的适用范围 批复适用于答复下级机关的请示事项。 二、批复的特点 三、批复的写法
动,欧盟内部逐渐实现了人员、商品、服务和资本的自由流通。 不同成员国人员可以自由任何一个成员国工作、学习或居住。 欧洲联盟的人口为 ,是世界是最大和最富庶的市场之一。 服务行业占欧盟国民生产总值的 65%,工业占 %,农业占 %。 1995年 12月,马德里欧盟首脑会议确定欧元为欧盟未来的统一货币,并确定了日程表:1999年 1月 1日正式进入欧元体系。 欧盟拥有自身的机构,可
或三乙醇胺过柱; ②除去未结合和结合不牢的蛋白:先用NaHCO3洗脱,再用解脱剂处理; 解脱剂: 3mol/L 硫氰酸钾(或钠)、 电泳法: 利用分子量和电荷量不同进行分离 (三)纯化抗原的鉴定 蛋白含量测定: 紫外吸收法、双缩脲法、酚试剂法 分子量测定: SDSPAGE、凝胶过滤 纯度鉴定: 醋酸纤维膜电泳、 SDSPAGE、毛细管电泳、等电聚焦、高效液相层析 免疫活性鉴定: 双向免疫扩散
文本属性的设置。 制作简单的文本页面 插入特殊字符 插入水平线,给水平线设置颜色 插入时间 制作图文混排页面 插入图片的方法 设置有关的属性 制作交互图像页面 典型的交互图像页面 鼠标经过图像 导航条 练习思考 当网页被加入收藏夹时,(网页标题)作为网页的名字出现在收藏夹中。 练习思考
有的音节采用简拼 例如: 成功 cgong,chg, chengg (4)笔形输入 拆成八种基本元素 , 用数字 1~ 8表示 按笔划顺序输入 , 最多取六笔 对于独体字 , 笔划顺序输入 对于合体字 , 按左右 、 上下或内外分为两部分 , 每部分 最多取 3个笔划 约定编码 例如 , 小 ( 534) , 策 ( 314 725) , 传 ( 32 115) (5)双打输入 例如 , 网 (