基于单片机的语音录放系统设计研究内容摘要:

脉冲幅度 (PAM)调制信号。 时间和幅度都不连续的信号是数字信号。 第 7 页 共 32 页 从模拟磁带录音机和数字磁带录音机的比较来看,模拟录音存在很多缺点 : ( 1) 在录音、编辑和放音过程中混入的各种噪音不能被分离出来,形成对信号的损伤。 ( 2) 录音媒体的信噪比可成为记录信号信噪比的一部分。 ( 3) 录音磁头、放音磁头等呈现的非线性会使记录的信号也呈现非线性。 ( 4) 驱动、转动机械系统的不稳定会造成抖晃。 数录音是将模拟信号转变为离散的数字信号后进行记录的。 对于需要多次转接、复制的模拟录音,每转接 、复制一次,信号的质量下降程度就要累加一次,而数字录音就没有这一问题。 数字录音具有下列优占。 ( 1) 数字化的标准 (取样频率、量化比特数 )确定以后,性能的界限也就确定了,性能是稳定的。 ( 2) 录音是以“ 0”或“ 1”数字进行的,放音时,只需判断出“ 0”或“ 1”,即判断脉冲“有”“无”即可,因而记录媒体的信噪比与放音信噪比无直接的关系。 ( 3) 许多器件不需要具有线性。 ( 4) 驱动、转动系统的不稳定,由于时钟脉冲信号和存储器的作用,不会造成晃。 防混叠低 通滤波器 取样 / 保持 A/D 变 换器 交织 纠错码处理 模拟声频信号 数字音频信号 记录 图 数字录音系统图 模拟恢复低通滤波器 窗口 电路 D/A 变换器 纠错码处理 反交织 重放 数字声频信号 模拟声频信号 图 数字放音系统图 放音 录音 第 8 页 共 32 页 语音信号的数字化 将模拟信号转变成数字信号,需经过取样、量化和编码三个步骤。 取样 [1][3] ( 1) 取样定理 模拟声频信号可用幅度对时间的关系来表示,将模拟信号的幅度以一定的时间间隔取得样值,称为取样 (或采样、抽样 )。 取样的时间间隔称为取样周期,每秒内取样的次数称为取样频率。 根据取样定理,当取样频率 fs为被取样信号最高频率 fh的两倍时,则被取样信号可以被恢复,即 fs≥ 2fh ( 2)取样频率 取样频率的选取应考 虑以下两点 : 1) 声频信号的最高频率。 2)防混叠低通滤波器的截止特性。 数字音频的质量与采样频率和量化精度有关,数字音频可分为以下几个质量等级 [7]: 表 数字音频质量等级 信号类型 频率范围 (Hz) 采样频率 (KHz 量化精度 (位 ) 电话语音 200~3400 8 8 宽带音频 50~7000 16 16 调频广播 20~15K 16 高质量音频 20~20K 16 由于本系统录音的对象是人说话时的语音,人的语音频率大概在 300Hz至 间,根据取样定理,采 样频率应该高于 Hz,从表 ,普通语音选取的是8 KHz,但为了提高声音的保真度,减少滤波实现的难度,同时与微机的录音频率最大程度地接近,所以系统选取采样频率为。 3) 混叠的防止 经过取样后,原信号的频谱分布要有改变。 如果取样频率小于信号最高频率的两倍,或信号的实际最高频率超过了 fh ,则会产生频谱混叠现象,以后就无法将原信号复原,并且出现混叠噪声。 为了将声频信号严格限制在 fh 以下,应先让原信号通过一个高频截止频率为 fh 的低通滤波器后再进行取样。 4) 取样保持电路 取样保持电路是在 A/D变换器之前,为使取样保持一定时间而设的。 由于 A/D变换器的转换需要一定时间才能完成,而输入的模拟信号是不断变化的,因此取样值必须保持一定时间。 第 9 页 共 32 页 5) 取样产生的孔径效应 取样定理所叙述的由取样的 PAM 信号可以完全恢复原模拟信号是有条件的,即取样脉冲的宽度 (即脉冲所占时间 )应为无限小,但实际的取样脉冲都有一定的宽度,这就会使恢复的模拟 信号的高频特性产生失真,这种效应称为孔径效应。 实验证明,当取样脉冲宽度为取样周期的 1/4时,孔径效应所产生的高频损失约为 ,人耳对它不能察觉到,不会成为问题。 量化 [1][3] ( 1) 量化的概念 将模拟信号的取样值,经“四舍五入”的方法转换成一种数字信号的过程称为量化。 在数字语音技术中,我们采用二进制表示一个数,即用“ 1”“ 0”来表示一个数,逢 2进 1,用电路的接通和断开即可实现。 采用二进制时的有效位数称为比特数或位数,在进行舍入运算的过程中会产生舍入误差。 由取样定理知道,如果取样频率能 满足这个定理,就会完全恢复原波形,但要真正完全恢复原波形,则需要无穷多位数。 在通常的数字系统中,每个取样点都会产生舍入误差,并且存在与这种舍入误差相应的失真和噪声,称为量化噪声或量化失真。 量化阶 梯数,或量化级数,是指量化所能取值的数目。 以二进制量化时,位数越多,量化阶梯数也就越多, 16位的量化阶梯数为 65536个,量化误差己很小。 对于量化阶梯相等的量化方法称为线性量化或均匀量化,不相等则称为非线性量化或不均匀量化。 均匀量化的量化噪声也是恒值,因此信号幅度大时,信噪比高。 信号幅度小时,信噪比低,噪声较明显。 非均匀量化在信号幅度小的时候,量化阶梯高度也小,信噪比可以较好。 信号幅度大的部分,量化阶梯高度也大,虽然量化噪声大,但由于人耳的掩蔽效应,对信号幅度大时增大的噪声会感觉不出来。 由表 可以看出,对于普通语音,量化精度选取 8位就可以满足数字化语音质量的要求,因此本系统的量化位数就选取 8位。 2量化噪声 ( ) 当声噪信号为正弦波时,并且峰峰值为  1,则在单位负载上的功率 S为 () 于是,可以算出以 dB表示的信噪比为 N M () 可见,量化比特数 M越大,信噪比越好。 量化噪声是均匀分布在 0fs/2的频带中,2 2 22 20122 1 2 1 2MN V d V      2 2011S= sin22d   第 10 页 共 32 页 另外量化噪声的振幅为常数 ,它等于△,不随信号大小而改变,因而当信号很大时,系统的信噪比很高。 但当信号很小时,则量化噪声对系统的音质影响就将十分明显。 量化噪声的减低对于量化噪声可采用在信号中加给高频抖动信号的方法,量化后,再减去高频抖动信号,而使量化噪声白噪声化。 量化噪声随量化比特数增大而相应减小,但不能减为零。 量化噪声是不同于白噪声 (即等带宽能量相等的噪声 )的一种高频噪声,它是由比较少的孤立频谱重叠而成的噪声。 因此在听感上与白噪声不同,是一种较粗糙的、刺耳的、称为颗粒性噪声的声音。 可以将一种称为高频脉动的、与量化阶梯高度相等的小振 幅白噪声与信号重叠,经量化后,颗粒性噪声即被白噪声化,使听感变好。 理论上将与量化阶梯高度 v相等的均匀分布的高频抖动在量化前先与信号相重叠,量化后再将高频抖动除去,量化噪声就成为宽度为 V、电功率 v2/12的均匀分布的白噪声。 另外 ,还可由过取样减低量化噪声,利用非均匀量化的输入输出特性也可减低量化噪声。 编码 [1][3] 二进制使用“ 0”或“ 1”两个数字,逢二进一,用二进制数表示某一数值时,这一二进制数称为字,这种表示过程称为二进制编码。 常用的各种二进制码有自然二进制码、偏移二进制码、 2的补码、偏 移反射二进制码和折叠二进制码。 将模拟信号转换为数码,然后再转换成二进制数字信号的方法称为脉冲编码调制 (PCM),冠以脉冲是因为转换后的数字信号以脉冲形式出现。 数字信号的检错、纠错及模拟信号的恢复 数字信号的检错和纠错 [1] 数字信号在传输或记录过程会产生误码,根据产生的状态,误码可分为随机性误码和突发性误码两类。 随机性误码是指彼此孤立的误码,突发性误码是指彼此连续的集中误码。 为了避免重放已记录的数字信号时,由于各种原因所造成的连续的突发性误码影响重放,采取在记录时改变数字信号的顺序,重放 时再按原来顺序重排回来的措施称为交织。 经过交织,可以将记录媒质上所产生的突发性误码,在信号恢复为原来顺序后被分散开形成随机性误码,以便于采取措施进行纠错。 常用的检错和纠错方法有 :奇偶校验码、交叉交织码、循环冗余校验码和邻接码。 第 11 页 共 32 页 模拟信号的恢复 数字信号经反交织、纠错码处理和 D/A变换后,还要经窗口电路和低通滤波器才能恢复为模拟信号。 ( 1)窗口电路 D/A 变换器的输出信号需馈送到一个窗口电路,窗口电路是由一个模拟开关和两个缓冲放大器组成。 因为 D/A变换器的输出信号必须经过一定时间后才能达到稳定值 ,利用来自模拟开关的控制信号,可在波形稳定后读出电压值,输出 PAM信号。 ( 2)解调低通滤波器 当窗口电路输出的 PAM信号,如果设计得使下一个脉冲正好在上一则通过低通滤波器后的脉冲串可变为各个脉冲响应的合成波,重现出原信号的波形。 第 12 页 共 32 页 第三章 系统的硬件设计 在前一章介绍的数字录音原理的基础上,结合实际的情况和需要,从系统的任务和要求入手,开始对系统进行总体设计。 系统的硬件总体设计 嵌入式数字录音系统应由下面各部分组成,如图。 本嵌 入式数字录音系统采用包含有 AD与 DA电路的单片机来实现模拟信号和数字信号的相互转换,因此不需要再另外设计专门的 AD与 DA变换电路,其中单片机中的 DA变换己实现窗口电路的功能,所以本系统也无需再设计窗口电路。 在语音信号从驻极体麦克风进入通用单片机之前,应该进行信号的放大和滤波处理,所以应有相应的输入电路和器件。 同样在放音的时候,信号经过 DA变换后,也要经过滤波和放大处理,最后通过扬声器将语音播放出来。 为了保证录音时间满足要求,本系统连接了一片 Flash Memory来存储语音文件和其它的相关参数。 Flash Memory又称闪烁存储器、快闪存储器,是一种高密度低成本的大容量新型半导体存储器,由于 Flash Memory断电后数据不会丢失,同时它的容量较大,32M的空间在 ,录音可达到 40多分钟的时间。 因此, Flash Memory是实现本系统各种功能的保证,也是系统的关键技术之一。 考虑到应对本数字录音系统进行控制,以实现录放音等操作,所以本系统设计了 TTL232接口与 PC机相连, PC机发送相放大 滤波 采样保持 A/ D 单片机 存储器 D/A 窗口电路 滤波 放大 输入 输出 电压调整 +3VDC 5VDC 输入 +5VDC 图 系统总体结构框图 第 13 页 共 32 页 应的指令控制单片机进行不同的操作。 本系统主要由通用单片机、一片 Flash Memory,输入信 号放大电路和输出信号电路组成,通过 TTL232接口与 PC机相连,当 PC机发出相应的指令,系统可执行相应的操作,这些操作包括 :录音开始、录音结束、放音开始、中断放音、传送文件、擦除块、读取系统参数、读取列表区数据 [6]。 如下图 : 在录音时,声音信号放大后通过 AD管脚进入单片机,经过 AD转换后,数据被存储在Flash Memory 中,放音时单片机将存储在 Flash Memory中的语音数字信号 (可以是录音数字文件数据,也可以是固定的语音文件数据 )。 经过 DA转换后再经 DA管脚输出,经输出电路通过扬声器将声音播放出来。 录音的命令格式是 :RECORD[文件名 ], [日期 ], [时间 ], [格式 ]。 录音结。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。