基于8051的声控设计(编辑修改稿)内容摘要:

键来执行指令,也就是说计算机可以听懂人们讲话,并且加以处理完成特定的工作,进一步让计算机与人进行交谈。 3. 1 声控计算机分类 依系统所能辨认单字多寡可以分类为以下三种: ( 1) 特定词汇:几个单词,词或是词组。 ( 2) 少量词汇:数十个 单字,词或是词组。 ( 3) 大量词汇:涵盖所有的单字,词或是词组发音。 以中文语音辨认而言便是所有的中文字。 依用户是否需要是先做训练分为: ( 1)特定语者 声控系统只能辨认某一特定用户的声音,用户在第一次使用此系统时需将所要辨认的词汇念过一到两遍,当做语音参考样本。 谁来辨认说出语音,辨认时会很准确,当然如果训练时是男生的声音,如其他的男生来辨认,只要腔调及音频不要差异太大,仍然可以辨认出来。 ( 2)语者调适 用户只要曾经对辨认系统训练过,此系统便可辨认出他的声音,是一种比较有灵活的做法,用户不需要念完所有的音 ,只要念过一部分的单音后,系统会自动将语音参考样本做调整。 依说话者的方式分类为: ( 1)单音辨认:系统只能辨认单音,因此用户所说的每一个字必须分开来。 ( 2)连续音辨认:系统可以接受语音者连续发音。 由以上几种分类说明可以看出,一套最理想的声控计算机系统应该是大量词汇,不特定语者连续音语音辨认系统,一般人不需要经过学习,便可以让计算机听懂他发出的语音,也就是说只要对着计算机说话便可以直接来控制计算机动作 了,但是要完成这样的一套高辨认率的系统实在不是一件容易的工作。 一般在应用上,特定语者,少量词汇 的单音辨认系统便可以满足我们的特定需求,若能先完成一套简单而又高辨认率的声控系统,在不影响辨认率的情况下而后再逐渐加大词汇量,或是修改语者训练的方式,采用语者调适的方法,也可以提升声控系统的整体性能,增加使用的方便性。 声控计算机的基本规格 一般的声控计算机的基本规格: ( 1)辨认率高 ( 2)特定语者 ( 3)少量词汇 ( 4)单音辨认 声控计算机的应用 声控的应用范围很多,一般可以分为以下几种: ( 1)计算机接口应用:利用声音控制屏幕显示(如简报系统,多媒体展示),或利用声控来下达计算机指令与 键盘同时操作(如应用在 CAI,GAME 中)。 ( 2)自动化控制:利用声音来控制机器人在高危险度的场所工作,或各种机械操作,或是声控仪表操作。 ( 3)消费性产品应用:如家电控制,电视,音响,电灯或语音自动拨号,汽车声控设备,儿童玩具声控。 ( 4)文本处理器:利用语音来输入文字(如听写机或是声控文书处理器) ( 5)利用语音辨识技术设计门禁管理系统。 4 声控模块硬件配置 声控模块 VCMM 是由单芯片 89C2051 控制语音辨识专用芯片 RSC364,单芯片只用 4 条 I/O 线便可以控制声控芯片动作。 声控模块 VCMM功能 ( 1)利用本套系统可以自行设计独立操作型特定语者声控系统,产品附加价值高。 ( 2)本系统特定语者的单词,字,词语音辨识。 ( 3)不限定说话语言,中英文皆可。 ( 4)具有自动语音输入侦测的功能。 ( 5)特定语者辨识率可达 98%以上,反应时间小于 1秒。 ( 6)系统参数及语音参考样本一但输入后数据可以长久保存。 ( 7)系统采用模块化设计,扩充性佳,可适合不同的硬件工作平台。 ( 8)在线训练输入的语音可以压缩成语音数据而又系统说出来当做辨认结果确认。 ( 9)系统可以独立操作,不必依靠 PC。 ( 10)系统 包含有英文的语音提示语做语音动作引导。 ( 11)系统展示 5 组语音辨认功能。 ( 12)最多可以扩充控制到 60组语音辨认。 ( 13)需要外加 +5V 的电源供电。 ( 14)内建 DTMF 信号产生功能,可做电话拨号的实验。 ( 15)内建 4 只按键开关及 RS232串行通信接口。 ( 16)提供完整 8051 控制接口及声控芯片电路图。 ( 17)含 8051 汇编语言串行应用范例源程序及 PC VB RS232 元程序。 ( 18)可扩充软硬件功能做进一步产品设计或声控专题制作 声控模块 VCMM配备 ( 1) VCM 控制板成品 ( 2) +5V 的直流电源线 ( 3)小型喇叭 ( 4)系统工作磁盘 ( 5)展示操作书名书 ( 6)完整电路图 声控模块 VCMM硬件说明 U1 RSC364:声控芯片。 U2 FLASH:29C20 2M,内存语音样本及语音压缩数据。 U3 EPROM:存声控芯片程序代码, RSC364 可执行文件。 U4 89C2051:存 8051 声控程序代码。 U5 LM386:声频放大器。 U6 ICL232: RS232 电平转换芯片。 U7 7805: 5V 稳压 IC。 J1:电容式麦克风。 J2:外部电容式麦克风扩充接头输入。 J3: PWM 语音输出( DTMF 信号产生,电话拨号信号输出)。 J4: DAC 语音输出。 J5:喇叭输出接头。 J6: 9V DC 输入接头。 J7: 5V DC 输入接头,红色 +5V,黑色 GND。 VR1:喇叭输出音量控制。 J8: 89C2051 串行接口 I/O 输出接头。 J9: 89C2051I/O 输出接头。 J10:RS232 D 型 9 引脚的公接头。 J11:RSC364 声控芯片控制信号。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。