电子电路]基于凌阳spce061a单片机的语音控制小车的研究内容摘要:

50 语音识别子程序 51 中断子程序 53 动作子程序 54 软件的下载与仿真调试及结果分析 55 软件的下载 55 软件的仿真调试 58 仿真调试结果分析 62 实物效果验证 62 本章小结 62 第六章 总结与展望 63 参考文献 64 致 谢 65 附录 1 语音遥控小车源代码 66 附录 2 中英文对照参考文献 75 附录 3 凌阳 61A 板电路原理图 97 太原理工大学现代科技学院毕业设计(论文) 1 第一章 绪 论 语音识别是语音信号处理的重要研究方向之一,它是一门涉及面很广的交叉学科,与计算机、通信、语音语言学、数理统计、信号处理、神经生理学、神经心理学、模式识别、声学和人工智能等学科都有密切的联系。 它还涉及到生理学、心理学以及人的体态语言。 语音是语言信息的载体,语音识别的基本任务是将输入的语音转化为相应的语言代码。 这样,不仅使存储或传输这样的语言代码时的数码率比起存储或传输原来有语音信号来大幅度降低,而且还在于它把一种连续的语音信号变成了一 种有限符号,这样的符号容易被计算机(或专用信息处理单元)理解其含义,并且便于与人进行交流,因而语音识别得到十分广泛的应用 [1]。 随着计算机技术、模式识别和信号处理技术及声学技术等的发展,使得能满足各种需要的语音识别系统的实现成为可能。 近二三十年来,语音识别在工业、军事、交通、医学、民用诸方面,特别是在计算机、信息处理、通信与电子系统、自动控制等领域中有着广泛的应用。 当今,语音识别产品在人机交互应用中已经占到越来越大的比例。 语音识别技术发展到今天,除了 PC 机的语音识别系统正趋于成熟外,随着语音算法的深入研 究和集成电路技术的发展,出现了一些具有实用价值和市场前景的语音识别芯片。 近年来,随着消费类电子产品对低成本、高稳健性的语音识别芯片的需求快速增加,使得语音识别系统大量地从实验室的 PC 平台转移到嵌入式设备中。 通过研究者的不断努力,现在嵌入式非特定人语音识别系统识别精度已经达到 98%以上,而对特定人语音识别系统的识别精度就更高了 [2]。 嵌入式语音识别系统与 PC 机的语音识别系统相比,虽然其运算速度和存储容量有限,但它具有自己的一些特点。 首先,它是一个完整的语音识别系统。 除语音识别功能外,为了有一个友好的人机界面 和对识别正确与否的验证,该系统还具备语音提示(语音合成)及语音回放(语音编码记录)功能。 其次,嵌入式语音识别系统多为实时系统。 即当用户说完待识别的词条后,系统立即完成识别功能并有所回应。 第三,嵌入式语音识别系统具有体积小,可靠性高、耗电省、投入少 、 价格低便携性好,可支持移动作业等优点。 这是嵌入式语音识别系统与 PC 机的语音识别系统相比最大的优势。 嵌入式语音识别系统的优点使得其应用的领域十分广泛 [3]。 语音识别技术目前在嵌入式系统中的应用主要为语音命令控制,它使得原本需要手工操作的工作用语音就可以方便地完成。 语音命令控制可广泛用于家电语音遥控、玩具、智能仪器及移动电话等便携设备中。 使用语音作为人机交互的途径对于使用者来说是最自然的一种方式,同时设备的小型化也要求省略键盘以节省体积。 语音识别技术是语音处理技术的一个分支。 语音处理技术发展过程也就是语音识别技术的发展史。 由此可以将语音识别分为三个阶段。 第一个阶段是萌芽阶段,在这一阶段( 20 世纪 30 年代至 50 年代),人们对语音处理的研究主要是根据语音学知识,提取若干特征参数,并利用这些参数制作成模拟电路来模仿人的发音过程,实现简单的语音处理功能。 语音识别的研究工作始 于 50 年代,它开始的标志是 ATamp。 T Bell 实验室实现了第一个可识别十个英文数字的语音识别系统 ——Audry 系统。 第二个阶段是发展阶段,在这一阶段( 20 世纪 60 年代至 80 年代初),随着集成电路技术和计算机技术的发展,语音识别的理论和技术亦日趋完善和成熟。 60 年代,提出了用动态规划( DP)方太原理工大学现代科技学院毕业设计(论文) 2 法来解决语音识别中不等长的问题。 70 年代,出现了基于线性预测倒谱和动态时间规整技术( DTW)技术的特定人孤立语音识别系统。 80 年代,最显著的特征是 HMM 模型和人工神经元网络( ANN)在语音识别中的成功应用。 第三个阶段是实 用阶段,在这一阶段( 20 世纪 90 年代至今),随着遵循摩尔定律的超大规模集成电路技术的迅速发展,极大地促进了计算机多媒体技术和人工智能技术的迅猛发展,使人类社会进入到数字信息时代。 在此社会背景下,人们对语音识别技术的实际需求愈发迫切,这极大地促进了语音识别技术的不断深入和发展,使语音识别系统从实验室走向实用,从而不断出现利用现语音识别技术的产品 [4]。 我国的语音识别系统的研究起步比较晚,但也取得了很好的成绩,研究水平也从实验室逐步走向实用。 从 1987 年开始执行国家 863 计划后,国家 863 智能计算机专家组为语 音识别技术研究专门立项,每两年滚动一次。 我国 PC 机语音识别技术的研究水平己经基本上与国外同步,在汉语语音识别技术上还有自己的特点与优势,但独立开发的专用汉语语音识别芯片还是较少,多数都是与国外研究机构合作开发研制的 [3]。 本文的主要工作: ( 1)本文在阐述语音信号处理知识、语音识别原理及 SPCE061A 单片机主要特点的基础上,进行孤立词的嵌入式语音识别系统硬件和软件设计以及语音控制小车实物的设计。 ( 2)依据设计任务的要求,硬件电路要包括核心部件的外围电路设计和小车控制电路的设计。 基于嵌入式系统的特点,本 系统的硬件电路具有体积小,性能稳定、价格低廉的优点。 ( 3)对语音控制小车的硬、软件设计与装配后,采用凌阳公司的集成开发环境181。 ‟nSP IDE 进行软件的编译、链接、下载与仿真调试,最终实现语音控制小车实物的语音控制功能。 太原理工大学现代科技学院毕业设计(论文) 3 第二章 语音 处理与 识别 技术 基础 概述 语音是语言的声学表现,是人类交流信息最自然、最有效、最方便的手段,也是人类进行思维的一种依托。 人类进入信息时代以后,用现代手段研究语音处理技术,使人们能更加有效地产生、传输、存储和获取语言信息,这对于促 进社会的发展具有十分重要的意义。 语音识别以语音为研究对象,它是语音信号处理的一个重要研究方向,是模式识别的一个分支,涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多领域,甚至还涉及到人的体态语言(如人在说话时的表情、手势等行为动作可帮助对方理解),其最终目标是实现人与机器进行自然语言通信。 语音信号分析技术 语音信号分析是语音信号处理的前提和基础,只有分析出代表语音信号本质特征的参数,才有可能利用这些参数进行高效的语音识别处理。 根据分析方法不同可将语音信号分析分为模型分析法和非模型分析 法。 对于嵌入式语音识别系统采用依据模型进行分析的线性预测分析是比较好的。 在对语音信号分析之前应将语音信号进行前端处理,其中包括语音的数字化、滤波、预处理等,这为语音信号特征提取和语音识别打基础。 滤波与 A/D 转换 滤波的目的有两个: ( 1) 抑制输入信号各分量中频率超出 /2nf 的所有分量( nf 为采样频率),以防止混叠干扰。 ( 2) 抑制 50Hz 的电源工频干扰。 滤波器必须是一个带通滤波器。 为了减少硬件设备 ,可以采用数字滤波器。 A/D 转换器是将原始的模拟语音信号变为数字信号,从而得到时间和幅度上均为离散的数字语音信号。 A/D 转换时采样频率的选择很重要,它关系到采样过程中是否会丢失信息,在语音信号处理中,采样频率通常为 7l0kHz。 由此可见,选择的 A/D 转换器性能的好坏对语音信号的处理也是很重要的 [1]。 预处理 预处理一般包括预加重、加窗、分帧和端点检测等。 预加重的目的是提升高频部分,使信号的频谱变得平坦,保持在低频到高频的整个频带中,能用同样的信噪比求频谱,以便进行频谱分析或声道 参数分析。 加窗分帧的目的是为了利用有限容量的数据区依次处理数量极大的语音数据。 根据语音信号在l020ms 内语音信号特性不变的特点,一般取帧长为 20ms,帧移为帧长的 01/2 倍。 常太原理工大学现代科技学院毕业设计(论文) 4 用的函数窗为汉明窗、汉宁窗和矩形窗。 经过加窗分帧处理后,语音信号就已经被分割成一帧一帧的加窗函数的短时信号,然后再把每一个短时语音帧看成平稳的随机信号,利用数字信号处理技术来提取语音特征参数。 在进行处理时,按帧从数据区中取出数据,处理完成后再取下一帧。 最后得到由每一帧参数组成的语音特征参数的时间序列。 端点检测是将语音信号从背景噪 声中提取出来,以确定语音信号的起止点 [5]。 语音信号的时域分析 ( 1)短时平均能量分析 短时能量定义为 设第 n 帧语音信号 ()nXm的短时能量 nE 表示为 1 20 ()NnnmE x m ( ) 其中, N—帧长 短时能量的用途有: 1)可以区分浊音段与清音段,因为浊音时 nE 值比清音时大的多。 2)可以用来区分声母与韵母的分界是,无声与有声的分界,连字(指字之间无间隙)的分界等。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。