集团语音识别技术在业务支撑领域的应用研究开题报告内容摘要:

音的识别,及针对移动客服领域录音的优化。 场景分割: 将一个通话录音中的用户语音和坐席语音分离出来,从而分别对中高端 客户和客服的语音进行针对性的分析。 情绪侦测: 对通话中用户或坐席的情绪进行自动侦测与判断,一旦发现异常,可及时记录或预警。 语速检测: 对分离后的坐席或坐席语音进行语速检测,如语速过快则可能用户很难听清楚,影响服务质量,而语速过慢则可能坐席技能是不够熟练、或者工作状态不佳。 静音检测: 检测录音文件中长时静音(冷场、用户等待时间)的状态,静音时长的检测策略可在系统中灵活设置与修改。 难点及解决方案 难点 1: 语音转写 解决方案: 需要与集成商 合作,对 客服中心的 历史录音进行训练,同时梳理客户服务热线的 业务逻辑、知识库。 难点 2:自动质检规则 解决方 案: 符合对语音数据 的质检策略和规则,如语速的基准值、情绪的基准值等,可通过对历史人工质检数据进行分析和建模。 难点 3:业务分类策略 解决方案: 以客服中心 目前的主要业务选项作为分类目标,对主流的分类算法进行分析与实验,使用文本分类器的区分性训练、支持向量机、最大熵等分类技术,研究可适用于复杂任务的分类算法。 主要技术方案和关键技术 通过对语音 信息数据挖掘 技术、客服业务、呼叫中心录音模块、客服质检流程等进行研究和应用设计,依托现有平台建设 中高端客户信息数据挖掘 系统,下图是 该 系统的主要功能组成模块和组成结构: D e v e l o p e rD e b u g g e rA p p l i c a t i o ni S PI M SA n a l y z e rT u n e rS u p p o r t e rR e s e a r c h e rR e c o g n iz e r E n g in eG r a m m a r S y s t e mG r a m m a r C o m p i l e rA b n f 2 g x m lG r a m m a r P a r s e rG r a m m a r C a c h e M a n a g e rS e m a n t i c I n t e r p r e t a t i o nK W S C o r eS p e a k e r S e g m e n tA b n o m a l E m o t i o nK e y w o r d S p o t t i n gL e x i c o nR e s o u r c e M a n a g e rR e c o g n i z e r P a r a m e t e r sV o i c e A c t i v a t i o n D e c t e c tV A D c o r eA u d i o S o u r c e P r o v i d e rN M SD i a l o g i cM i c r o p h o n eL o g g i n gC a l l l o g g i n gS y s t e m l o g g i n gA u d i o D r i v e r s , T h r e a d s , A C E , X M L , u r i , C o n f i g u r a t i o n , a n d m o r e .O S A d a p te r sM i c c r o s o f t W i n d o w s 2 0 0 0 / X P / 2 0 0 3 / V i s t a / 7 , R e d h a t L i n u x A S 3 / 4 / 5 , S u n S o l a r i s 9 / 1 0O p e r a tin g S y s te mi s r b a t r e ci s r m t r e ci s r a n a l y z e rR e c o g n i z e r A P IE n d p o i n t e r D e c t e c t e r A P Ik w s d e m oF e a t u r e E x t r a c t i o nT o o lsQ u i c k K W S A P IIS A P r o g r a m m in g In te r fa c e s 其中蓝色区域都属于 ISA 产品的核心功能模块,白色区域是和 ISA 产品有密切关系的第三方角色或组件。 可以看到 ISA 产品分为应用接口( ISR Programming Interface)、识别引擎( Recognizer Engine)和操作系统适配( OS Adpters)三层架构。 应用接口是 ISA 产品提供的用户开发接口,是系统最重要的对外功能,集成开发人员最关注这些接口的功能和使用方法。 数据挖掘 引擎是这些开发接口的功能实现者,同时还提供了多种工具和方法用于支持开发。 操作系统适配层屏蔽了多操作系统的复杂性,为识别引擎提供操作系统相关的底层支持。 这三个逻辑层共同构成了完整的 ISA 产品架构。 (四)广西移动《 IVR 自动拨测服务项目 》 研究总体框架 IVR 业务探测系统主要由三部分组成:  媒体网关 实现 PSTN/GSM/CDMA 到 VOIP 的协议转换。  语音识别服务 实现 IVR 探测时的 语音识别。  IVR 业务探测应用 整合媒体网关和语音识别 服务 ,实现 IVR 业务探测应用。 数 据I V Rw e b S e r v i c e短 信 营 业 厅数 据 库 / 语 音网 路 交 换 机媒 体 网 关 / 媒 体 代 理语 音 设 别 服 务I V R 探 测 服 务 . . .语 音 解决自动拨测问题 IVR 属于语音设备,实现业务探测和自动测试就需要用机器来模拟人工进行拨测。 但使用呼叫中心现有的交换机或使用手机终端都难以彻底解决问题。 我们在大量的调研的基础上,决定采用 VOIP 网关的技术方案。 既可以完成自动拨测,又可以同时模拟固话、 CDMA、 GSM 号码进行多路拨测。 这样,就可以实现对电信用户、联通用户、中国移动本省、它省用户(包括全球通、神州行、动感地带等不同品牌,钻、金、银等不同级别的用户)的 IVR 流程模拟拨测。 解决语音 识别困难 当机器拨入 IVR 系统后,需要与 IVR 流程进行交互,包括二次拨号、信息录入(如密码、手机号、身份证、年月日等),这依赖于语音识别技术。 机器收到语音信息后,需要根据语音编码、去噪、模式识别等技术,将这些信息转换为人可以识别的信息,然后再使用人可识别信息进行业务规则判定。 目前,语音识别技术虽有提高但仍有很大的局限性。 本项目 采用一种特殊的语音识别技术,加上我们对业务积累来实现 IVR 的业务探测和自动测试。 通过语音识别厂家的语音识别引擎,配合有效的业务规则,可以将语音识别的准确率提高到一个新的高度,使之胜任 IVR 业务探测。 主要技术方案和关键技术 IVR 业务探测系统的主要工作流程如下 : 1. 探测系统开始工作后,到达指定时间时,开始通过媒体网关 GS8 进行呼叫,拨打欲测的 IVR 平台后; 2. 拨通后,对平台播放的任何流程语音 进行录音,并将录音传递给 语音识别系统 进行实时语音识别; 3. 语音识别系统 将收到的语音与系统中保存的目标语音进行识别,并将识别结果 (正确或错误 ) 返回给探测程序; 4. 探测程序收到识别结果后,记录进探测报告。 如果识别错误,则探测程序依据探测流程是否。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。