基于语音合成芯片tc8830af语音报时系统的设计内容摘要:

1200—9600bps。 另外,所提取出的 PARCOR系数也好, LPC系数也好,都是将数据存放入计算机内存中,当要合成某个语音时,就去调用已存储在相应的内存单元中的系数,通过有关运算还原出数字语音,以便最终获取声音。 不过,这种方式也受内存容量的限制,所能合成的词汇数也是有限的。 规则合成法 规则合成法以音素法为例,它将每个发音的音素(对应具有固定或一定范围的频率)所表示的语音信号存储起来,拼音时随时取用。 这种以最小单位进行的方法,实现起来挺麻烦,而 且更复杂困难。 国内外研究现状 目前国内由于有关 GPS 导航的消费类电子产品、和各类行业应用产品呈现日益深入发展的趋势,导致国内许多技术开发公司对嵌入式的中文语音合成芯片、英文语音合成芯片、地方性方言语音合成芯片,以及混合语种的语音合成芯片的应用激增,呈逐渐扩大的趋势。 有关中文普通话语音合成芯片,目前国内主流的、并在市场上得到广泛应用的解决方案,主要有北京宇音天下科技有限公司的成熟产品 OSYNO6188,以及科大讯飞所研制的 XFS3011 语音合成芯片,当然还有华帮华邦 WINBOND 的 WTS70 日本 OKI 公司的ML2110/MSM7630 系列。 目前从事中文语音 IC 设计的公司,有的刚刚起步,有的做出来的产品效果不尽人意,有的产品价格极高。 如台湾华邦 WINBOND 的中文语音合成芯片,其每片 8 个美元的市场报价,极大的限制了中文语音合成芯片大规模走向市场。 哈尔滨理工大学远东学院学士学位论文 3 第 2章 语音合成技术概述 语音信号 语音有关的术语概念 ( 1)语音 由人的声道发出的声音,主要由共振峰确定其频率特性。 ( 2)发音 所谓发音是指出语音的基本生理过程。 语声波形是一种声压波。 语音主要是由于声带振动而发出的声能。 ( 3)声道 声道是一根从声门延 伸到嘴唇的非均匀截面的声管,它的形状变化是时间的函数。 ( 4)共振峰 由一些语音引起声道共振,组成一个音响共鸣系统。 声道管的谐振频率和声道的形状与大小有关,每种形状都有一种或一套共振峰频率作为特征。 ( 5)滑音 是一种中间形式,即发音时,从某个音素 A变化到另一个音素 B时,便产生一种从 A的固有发音形式转向 B的固有发音形式的中间发音形式。 语音信号的采样频率 香农采样定理表明,语音信号的采样频率是语音所必需的频带宽度的 2倍以上。 例如,要保持最高频率为 5kHz带宽的频谱,采样频率最低必须为 10kHz。 人的耳朵可 听到频率为 20Hz20kHz的声音。 在处理连续语音时,我们可以根据前后的信息进行估计与识别的处理,所以用 8kHz就足以胜任了。 对语音信号进行采样的频率叫做采样频率,将采样频率 f 乘以语音信号采样值的编码位数 m,即 fm,就得到了表征语音合成芯片的一个重要参数指标 —— 比特率。 fm,就是存储 1 秒钟的语音信息所必需的位数,其数值与传输语音信号的线路所必需的频带宽度有关系。 语音的数字合成方法 波形存储法 波形存储法是一种相对简单的语音合成技术。 其基本思想和作法是:首先由人讲一些单词、词组或短语,在内存中建立 特别的词汇语音库,然后就可以在今后的处理过程中,将相应的数字量调取出来。 在建立词汇语音库的过程中,将特定的单词、词组或短语的声波波形通过转变成数字信号而存入存储单元中。 图 21所示为波形存储法的过程示意图。 哈尔滨理工大学远东学院学士学位论文 4 图 21 波形存储法过程示意图 参数合成法 参数合成法也称为分析合成法,是一种比较复杂的方法,它是基于分析与模拟人的发音器官,以便寻求并建立描述过程。 可以有共振峰、频谱包络和声道滤波三种方式来提取语音信息,因此这种方法不是直接利用人发出的 声音,而是从人的语音中提取与语音参数有关的特征参数。 最常用的方法是提取 PARCOR系数(偏自相关系数)和 LPC系数(线性预测系数)。 在合成过程中,通过相应数学模型的计算去人工控制这些参数的合成。 实现合成的方法,则因线性预测系数、语音共振峰等而各不相同 [3]。 利用这种方法,信息量可压缩到 1200—9600bps。 另外,所提取出的 PARCOR系数也好, LPC系数也好,都是将数据存放入计算机内存中,当要合成某个语音时,就去调用已存储在相应的内存单元中的系数,通过有关运算还原出数字语音,以便最终获取声音。 不过,这 种方式也受内存容量的限制,所能合成的词汇数也是有限的。 图 22所示是用参数合成法实现的语音输出系统原理示意图。 图 22 用参数合成法的装置框图 预处理。 将含有所需单词、句的话音由声转电信号 采样获得语音信号的数字表示 建立所要求的语音库 存储器 待合成内容 计算机根据词汇表结构,按一定规则获取语音数据 组织逻辑 语音合成装置 功放 扬声器 CPU 存储器 I/O 接口 电路 通信 接口 语音合成部分 专用存储器 控制接口电路 语音合成器 总线 上位机 扬声器 哈尔滨理工大学远东学院学士学位论文 5 规则合成法 规则合成法以音素法为例,它将每个发音的音素(对应具有固定或一定范围的频率)所表示的语音信号存储起来,拼音时随时取用。 这种以最小单位进行的方法,实现起来挺麻烦,而且更复杂困难。 语音记录与语音库的建立 语音合成是语音模拟信号经过采样,在计算机内存中反映为 一个数字序列;而当这一数字序列最终输出时,为一特定语音的过程。 那么这一数字序列就是表征一定意义的语音词汇,将有关这些数字序列存储起来,就是创建语音库的过程。 语音记录 语音的产生是语声经过话筒,靠振膜接受声波振动,并转变为电信号。 话筒分动圈式、驻极体电容式等类型,关于这两种类型的话筒分别叙述如下: 动圈式 它是依靠振膜的机械振动带动置于磁场中的线圈振动,从而引起磁场的变化,在线圈上产生变化的电信号。 话筒内部线圈与振膜直接相连,振膜的振动带动线圈的振动,将声能变成机械能,并由机械能转为电能的形式。 驻极体 电容式 这种话筒时利用永久性带有电荷的塑料薄膜做振膜,不受外部电场和磁场的影响。 当受到声波的作用后,振膜产生振动,引起电级之间电场的变化,而后将这种固定电级之间的变化转变为电信号。 当话筒将声波转化为电能后,再经模 /数转换,便可得到数字表征的语声信号,通过分析或处理再由存储器存储这些数字序列,便将语音以数字表征的形式记录下来。 语音库的建立 在波形语音合成方式里,我们得到的是语音的数字编码形式,记载的数字编码如一一得以复原,则可复述原先所记录的语音。 由于语音发出的过程是以时间为基本轴的,这势必会造成停顿时 间过长的缺点,以至于浪费内存,为此,需要根据时间轴来进行录音编辑。 关于编辑的基本思想是这样的: 第一,将所需的字、词或句通过话筒输入,并由语音合成芯片转换成数字量保存在存储器中; 第二,由计算机控制存储器内容得以复原后与时间有关,因此需要反复调整时间,以决定某一字、词或句子在一个存储器里所处的以时间为轴的具体位置,或者确定在存储器中的地址。 在参数合成法或规则合成法里,我们需要的字、词或语句将表征为一系列参数。 建立语音库时应记录语音信号的抽象表示形式,即以各种参数描述的有关字、词或句子的表示方式。 因为各个 参数针对一定字、词或句子都是具有联系意义的,彼此相辅而成,因此关于这二种方式的语音库建立可以按照如下形式进行: 第一,由磁带式录音机录制字、词或句,并尽可能将有关语声之间因发音受阻碍或停顿消除,然后进行分析、计算处理,取得参数编码,再由该类语音合成芯片的专用语哈尔滨理工大学远东学院学士学位论文 6 音存储器来存储参数,或交由计算机来管理。 第二,基于波形编码方式的输出结果,即通过波形编码方式获取有关语音库后,再由计算机控制,以便将这种语音库转变为由另一参数表示的语音库。 语音输出与语音库的调取 语音输出有很多种转换形式,但都可以归纳为采用波形编码 形式的数字编码进行解译的过程,也可以说是用波形合成法或规则合成法各参数控制输出的过程。 输出的最终形式是将语音通过扬声器得以传播出去。 语音输出 语音输出是将电形式转换为声形式的过程。 扬声器是实现这一最终语音合成结果的工具。 电信号变换为声信号,也就是电信号变换为空气压力的变化(即声波),其变换根据是置于磁路中的音圈里通过电流时产生力的现象,力的方向随电流的方向而变化。 音圈与振膜相连接,振膜的重量要轻,并且要具有压缩空气的足够的面积。 音圈的振动导致了振膜的振动,于是,最终的声波便从电信号方式转变出来。 语音库 的调取 计算机在建立语音库是主要是按时间轴和内存地址两种方式来确定字、词或句子在语音库中的位置,在语音库调取数据时,在语音库之外重新开辟一内存暂存区域,将有关语音库中的数据按照输出语音的先后顺序安排进入暂存单元,然后一一从内存中调取。 哈尔滨理工大学远东学院学士学位论文 7 第 3章 8031 单片机功能简介 8031 单片机的组成及结构 8031 单片机的基本组成 8031单片机是目前国内广泛应用的单片机之一,它是在一块芯片上集成了 CPU、ROM、 RAM、定时器 /计数器和多种功能的 I/O端口等一台计算机所需要的基本功能部件。 8031内部包含了下列几个部件: ( 1)一个 8位 CPU; ( 2)一个片内振荡器及时钟电路; ( 3) 4K字节程序存储器; ( 4) 128字节数据存储器; ( 5)两个 16位可编程定时器 /计数器; ( 6)一个可编程全双工串行口; ( 7)四个 8位可编程并行 I/O端口; ( 8) 64K字节外部数据存储器和 64K字节程序存储器扩展控制电路; ( 9)五个中断源,两个优先级嵌套中断结构。 以上各部分通过总线相连接。 8031 单片机处理器及内部结构 8031单片机处理器及内部结构与一般微处理器相比,除了增加接口部分外,基本结构是相似的,但也有明显不同的地方,例 如 8031的数据指针 DPTR是专门为指示存储器地址而设置的寄存器。 ( 1)运算器 运算器的功能是进行算术运算和逻辑运算,可以实现对半字节、字节等数据进行操作。 8031单片机的运算器还包括一个布尔处理器,专门用来进行位操作。 ( 2)程序计数器 PC 8031单片机的程序计数器 PC用来存放即将要执行的指令的地址,共 16位。 可对 64K字节的程序存储器直接寻址。 若系统的程序存储器在片外 ,执行指令时 ,PC的低 8位经 P0口送出 ,PC的高 8位由 P2口送出。 PC是决定执行顺序的关键性寄存器,是任何一个微处理器都不可缺少的。 ( 3)指令寄存器 指令寄存器用于存放指令代码。 CPU执行指令时,从程序存储器中读取指令代码送入指令寄存器,经译码后由定时和控制电路发出相应的控制信号,完成指令的功能。 ( 4)工作寄存器区 通用工作寄存器相当于 CPU内部的小容量存储器,用来存放参加运算的数据、中间数哈尔滨理工大学远东学院学士学位论文 8 据或地址。 ( 5)专用寄存器区 专用寄存器区也可称为特殊功能寄存器区。 8031单片机的 CPU根据程序的需要访问有关的专用寄存器,从而正确地发出各种控制命令,完成指令规定的操作。 ( 6) 堆栈 8031单片机的堆栈安排在内部 RAM中,它的位置通过堆栈指 针 SP来设置,其深度可达 128字节。 ( 7)标志寄存器 标志寄存器是用来存放 ALU运算结果的各种特征。 程序在执行过程中经常需要根据这些标志来决定下一步应当如何操作。 8031 单片机的引脚功能 8031单片机采用 40引脚的双列直插封装方式。 图 31为 8031单片机的引脚图。 图 31 8031单片机的引脚图 40条引脚的功能简要说明如下: 1. 主电源引脚 VCC和 VSS ( 1) VCC( 40)。 正常操作时接 +5V电源。 ( 2) VSS( 20)。 接地。 1 40 2 39 3 38 4 37 5 36 6 35 7 34 8 33 9 8031 32 10 31 11 30 12 29 13 28 14 27。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。