基于虚拟仪器的语音识别_算法研究(编辑修改稿)内容摘要:

义,其具有虚拟面板并且测试功能由测试软件实现的一种计算机仪器系统。 使用者只要用鼠标点击虚拟面板,就可以操作这台计算机系统硬件平台,就如同使用一台专用的测量仪器。 虚拟仪器的特点可归纳为: ( 1)在通用硬件平台确 定后,由软件取代传统仪器中的硬件来完成仪器的功能。 ( 2)仪器的功能是由用户根据需要由软件来定义的,而不是事先由厂家定义好的。 ( 3)仪器性能的改进和功能扩展只需进行相关软件的设计更新,而不需购买新的仪器。 6 ( 4)研制周期较传统仪器大为缩短。 ( 5)虚拟仪器开放、灵活,可与计算机同步发展,可与网络及其它周边设备互 联。 决定虚拟仪器具备传统仪器不可能具备的上述特点的根本原因在于:“虚拟仪器的关键是软件”。 LABVIEW( Laboratory Virtual Instrument Engineering Workbench,实验室虚拟仪器工程平台)是美国 NI 公司 (National Instrument Company)推出的一种基于 G语言( Graphics Language,图形化编程语言)的虚拟仪器软件开发工具。 虚拟仪器的构成,如图 所示: 显 示 器信 号 分 析 及 处 理数 据 发 生 器A / D 转 换 器D / A 转 换 器信 号 调 理 器 信 号 调 理 器信 号 调 理 器各 类 接 口人 机 接 口信 号 输 入信 号 输 出 图 虚拟仪器的构成 LABVIEW 软件工具的特点可归纳为: ( 1) 图形化的编程方式,无须写任何文本格式的代码,是真正的工程师语言。 ( 2) 提供了丰富的数据采集、分析及存储的库函数。 ( 3) 既提供了传统的程序调试手段,如设置断点、单步运行,同时又提供了独到的高亮执行工具,使程序动画式运行,利于设计者观察程序运行的细节,使程序的调试和开发更为便捷。 ( 4) 32bit 的编译器编译生成 32bit 的编译程序,保证数据采集、测试和测量方案的高速执行。 ( 5) 囊括了 DAQ、 GPIB、 PXI、 VXI在内的各种仪器通信总 线标准的所有功能函数,使得不懂总线标准的开发者也能够驱动不同总线标准接口设备与仪器。 7 ( 6) 提供大量与外部代码或软件进行连接的机制,诸如 DLLs(动态连接库)、 DDE(共享库)、 ActiveX 等。 用 LABVIEW 设计的虚拟仪器控制系统主要包括三个部分: ( 1) 仪器前面板的设计 仪器前面板的设计是指在虚拟仪器的开发平台上,利用各类子模板图标创建用户界面,即虚拟仪器的前面板。 ( 2) 仪器流程和算法的设计 仪器流程和算法的设计是根据仪器功能的要求,利用虚拟仪器开发平台所提供的子模板,确定程序的流程图、所实现的 技术方法和主要的处理算法。 ( 3) I/O 接口仪器驱动程序的设计 I/O 接口仪器驱动程序是控制硬件设备的驱动程序,也是连接主控计算机与仪器设备的纽带。 用 LABVIEW 设计的虚拟仪器系统可脱离 LABVIEW 开发环境,最终用户看见的是和实际的硬件仪器相似的操作面板。 MATLAB 语言 MATLAB 语言 [1]是在 20 世纪 80 年代初期,由美国的 Math Works 软件开发公司推出的一种信号图像处理的数学工具软件。 它拥有功能全面的函数库,为了让用户脱离了复杂繁琐的程序计算过程,把大量的函数封装起来,大大提高了 工作效率。 利用 MATLAB可以实现符号运算、科学计算、算法研究、数据分析和可视化、数学建模和仿真、图形用户界面设计以及科学工程绘图等强大功能。 同时 MATLAB 为用户提供了丰富而实用的资源,它涵盖了许多门类的科学研究,如控制、通信、数学、经济、地理、数字信号处理和数字图像处理等。 其主要特点有: ( 1) 先进的技术界面支持 MATLAB 给用户提供的是一种最直观、最简洁的程序开发环境。 用 MATLAB 编程时,就如同在现实中的便签上列公式和求解一样。 ( 2) 开放式的体系结构 除了内部函数外,所有的 MATLAB 主包文件和各工具包文件都是对用户开放的源程序文件,用户可以通过修改源程序文件来构成新的适合自己使用的专用工具包。 8 ( 3) 简单易学 与 FORTRAN 和 C 语言等高级语言相比较, MATLAB 语法规则简单,语言的思维特点更符合人们在实际应用中的习惯。 ( 4) 丰富的函数工具箱 提供专门的对语音信号进行处理的工具箱。 对于比较简单的和“一次性”的问题,通过在直棂窗中直接输入一组指令求解是比较简便、快捷的。 但是当待解决问题所需的指令较多而且所用指令结构较复杂时,或者当一组指令通过改变少量参数就可 以被反复使用去解决不同问题时,直接在直棂窗中输入指令的方法就显得累赘、繁琐和笨拙。 设计 M脚本文件就是用来解决这个矛盾的。 M脚本文件是指: ( 1) 对于解决同一个问题,在文件中的指令形式和前后位置与在指令窗中输入的那组指令毫无任何区别。 ( 2) MATLAB 在运行这个脚本时,简单地从文件中读取那一条条指令,然后送到MATLAB 中去运行。 ( 3) 与在指令窗中直接运行质量一样,脚本文件运行时产生的变量都驻留在 MATLAB基本工作空间中。 ( 4) 文件的扩展名是“ .m”。 其具体步骤如下: 1) 编辑调试器的开启 在缺省的 情况下, M 文件编辑器( Editor/Debugger)不随 MATLAB 的启动而开启,通常只有在编写 M文件时才启动 M 文件编辑器窗口。 M 编辑器有多种功能:不仅可以编写 M文件,而且可以对 M 文件进行交互式调试;此外, M文件编辑器不仅可以处理带 .m扩展名的文件,而且可以阅读和编辑其他 ASCII 码的文件。 下面介绍 M 文件编辑器的几种启动方法: 点击 MATLAB 桌面上的“ ”图标,或选中菜单项 [File: New: MFile],可以打开空白的 M 文件编辑器。 点击 MATLAB 桌面上的“ ” 图标,或选中菜单项 [File: Open],可引出 Windows平台上标准的“ Open”文件选择对话框,通过常规的工具条操作,找到待打开文件所在文件夹,点选那个文件名后,再点击 [打开 ]键,即可引出相应文件夹的 M 文件编辑器。 用鼠标左键双击当前目录窗口中的所需 M 文件,可直接引出展示相应文件夹的 M文件编辑器。 2) 编辑器使用中的注意事项 9 ( 1) 编辑器的打印效果设置。 具体方法是:选中菜单项 [File: Page setup],引出一个页面设置对话框,该对话框可以对版面布局( Layout)、版头( Header)、字体( Fonts)等参数进行设置。 “ Layout”版面布局子项:选择“ Print header”,则打印的硬拷贝将会出现页眉,显示文件所在的全部路径、文件建立日期和页数。 “ Header”版头设置子项:设置版头的具体形式包含有版头的边界、布局及页数的显示方式等参数进行设置。 “ Fonts”字体设置子项:如果不点选“ Use editor font”,那么硬拷贝中的字体可能与编辑器显示的字体不同,一般情况下硬拷贝中的字体较大。 ( 2) 编辑器的段落格式、字体(形式、大小、颜色)、自动保存等都可由用户自己根据需要进行设置。 具体方法是:选中菜单项 [File: Preferences],引出一个参数设置对话框;展开弹出对话框左栏中的“ Editor/Debugger”项,出现以下 4个子项: “ Font amp。 Colors”子项:在对应该项的右侧栏中,可以对字体大小、颜色、类型进行设置。 “ Display”子项:如果勾选“ Enable data tips in edit mode” ,那么当光标移动到该编辑器文件中的某个变量名时,就会出现一个现场菜单,但显示出该变量内容的前提是,改变量已存在于 MATLAB 的工作空间。 “ Keyboard amp。 indenting”子项:对应栏用来设置快捷键习惯和文件段落缩进的习惯。 “ Auto save”子项:编辑器窗口中的文件发生改动后,文件会自动进行备份。 通过该子项中的“ Save options”栏,可以设置自动备份的时间间隔。 说明: 1. 运行 M文件的方法有很多种,而最常用的方法是: ( 1) 在指令窗中直接运行 M文件名(不带扩展名); ( 2) 在当前目录窗中,用鼠标右键单击所要运行的文件,再从引出的现场菜单中选择 [Run]菜单项。 2. 脚本文件第一行中的注释文件名一般与实际存放在目录上的文件名相同。 但这样做的目的仅仅是为了管理上的 一致,也为了便于用户记忆和查询。 事实上, *.m 的存放和调用与注释行中的名称并无关联。 3. 当使用 M文件编辑器调试并保存文件时,或在 MATLAB 指令窗中运行 M 文件时,不必写出文件的扩展名 .m。 10 4. 在 M文件编辑调试器中,可以用汉字注释,也可获得正确显示。 5. 注意:在 MATLAB 中,若发生汉字输入困难,可用鼠标右键点击,引出现场菜单;选中“属性”菜单项,引出“对话框”,或采取在微软输入法中选择“逐键指示”,或在智能输入法中选中“固定”。 结构 本课题研究的主要内容和方法如下: 根据识别 的需求,分析语音识别技术的重要性,针对语音识别系统的实用性提出本文研究的目标就是设计实现一个基于模板匹配识别算法的语音识别系统。 对语音识别系统进行设计研究,针对语音识别的功能需求,对比研究 VQ 和 DTW 算法的识别算法,结合 LABVIEW 和 MATLAB 各自优点综合设计出基于虚拟仪器的语音识别系统,用于语音识别功能的进一步研究。 本文共分为六个章节,具体结构如下: 第一章介绍了语音识别的学科背景与研究的发展历程,历史意义,本设计的软件平台以及本文选题的依据和内容安排。 第二章介绍了语音信号的 实时采集及 预处理,对语音信号的产生与数字化进行了分析,并详细介绍了语音信号的小波消噪及端点检测以及语音信号的特征提取,其中对当前应用较广泛的 MFCC 特征参数提取过程做了详细的讨论。 第三章 介绍了语音识别的几种算法,并对这几种算法作进一步的研究和改进,选择一种自认为比较合适的算法用于本次设计。 第四章介绍了非特定人连续语音识别系统的实现问题,介绍了系统的具体设计步骤,及其模板的建立与读取,并对试验结果进行了分析。 第五章简单介绍了整个设计所得出的结论。 第六章 总结与展望,对本文的研究工作进行阶段性总结,讨论了当 前存在的问题和将来可能的研究方向。 11 第二章 语音识别基本技术 语音识别基本技术包括语音信号的预处理、分帧、加窗和端点检测等时域和频域分析。 在语音识别系统中主要是采用基于模板匹配识别算法的研究,进行待测语音和模板语音的对比分析,再根据特定的判定准则得出最终的识别结果。 本章主要介绍语音识别基本技术。 语音信号的采集 语音识别系统基本框架 语音识别系统一般采用的是模式匹配的原理 [8],所以本质上是一种模式识别系统。 它的基本结构如图 所示,主要分为信号预处理、特征参数提取、模 式匹配和参考模板库几个单元。 语音信号是短时平稳随机信号,产生机理非常的复杂、内容较丰富并且有很大的不确定性,这使得语音识别比一般模式识别要困难很多。 语 音 信 号数 字 化去 噪 、 预处 理特 征 参数 提 取模 式 识 别参 考 模 板 库训练识别结果 图 语音识别系统基本结构图 语音识别系统的处理过程从一开始的对语音信号进行采集,即模拟语音信号转化为数字语音信号,随机语音经过录音设备转化为数字信号 (语音信号 )输入到语音识别系统进行识别。 对原始语音信号进行抗混叠滤波、去噪声,预加重处理和端点检测;根据端点检测得到有效语音信号,对其进行 特征参数提取,较好的特征参数应具备的特点是: 12 (1) 特征参数矢量的各分量之间具有良好的独立性; (2)特征参数能有效地代表该语音段,具有良好的区分度; (3)特征参数的计算要高效,最好也比较容易实现,保证语音识别的实时实现。 由于语音信号具有短时平稳的特性,所以语音信号的特征参数都是以一段短时语音信号为单位的,一般短时时间段取值为 20ms~ 30ms 之间。 对于识别参数的训练,根据识别方法的不同运用不同的训练方案,参考模板的特征参数一般是离线计算并存储起来的,为此,在系统使用前事先要录入一些已知信号,通过提取它 们的特征参数矢量序列,根据不同的识别方法进行训练,作为参考模式,这个过程就叫做训练过程。 识别过程就是通过对输入的语音信号与参考模板库中的语音。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。