语音识别在语言培训软件中的研究与应用.doc

约54页DOC格式手机打开展开

语音识别在语言培训软件中的研究与应用,页数 54 字数 28642摘 要语音识别技术是21世纪初信息技术领域十大重要的科技发展技术之一。长期以来,人们梦想与机器进行自然语音的交流,让机器明白你说什么。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。近二十年来,语音识别技术取得显著进步,当...
编号:10-25954大小:660.00K
分类: 论文>计算机论文

内容介绍

此文档由会员 李亮亮 发布

语音识别在语言培训软件中的研究与应用

页数 54 字数 28642

摘 要
语音识别技术是21世纪初信息技术领域十大重要的科技发展技术之一。长期以来,人们梦想与机器进行自然语音的交流,让机器明白你说什么。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。近二十年来,语音识别技术取得显著进步,当今,语音识别技术已日臻完善,并已进入实用阶段,采用嵌入式芯片设计技术研发的语音识别专用芯片系统,已包括了语音识别、语音编码、语音合成功能,该芯片大量用于智能语音玩具、手机等电子产品,一些应用型产品正在研发中,其商品化的过程也越来越快。目前,在信息处理、教育与商务应用、消费电子应用方面,语音识别技术都已经展现出了它的巨大优势,但将语音识别和语音比较技术同时运用在教育培训软件还比较少,特别用于外语培训软件系列,更是凤毛麟角了。我们正是根据这一实际工程领域的缺欠进行研究,初利用现有语音识别技术,并根据英语培训的特点加以改造,同时引入语音比较技术,大大提高学生学习英语乐趣,对中国人纠正英语的发音大有帮助。
我们在本课题中的设想是将语音识别技术应用在英语培训软件中,并就教育培训的一些新特点,在原有语音识别技术上,利用新的模式匹配算法,增加语音比较功能。就教育领域来讲,语音识别技术的最直接的应用就是帮助用户更好地练习语言技巧。在过去,用户只是通过简单的模仿来进行学习,而无法精确地比较自己发音的差异,为实现该功能,我们将引入语音比较的识别模式,当用户跟着计算机说完一句话后,计算机会根据标准发音和用户发音的波形按特定算法进行相似性的比较,由此估计用户的发音是否与标准有细节方面的差异。同时,基于语音比较技术而给出的分数也更具有公正性,并可以激励用户的学习潜质;

关键词:语音识别,语音比较,模式匹配,算法,计算机,波形比较

目 录

第一章 引 言 1
1.1 语音识别和语音比较概述 1
1.2 语音识别技术的国内外研究动态 2
1.3 论文的研究目的意义及主要工作 3
第二章 语音识别的基本概念及其技术 5
2.1 语音识别系统的分类 5
2.2 语音识别的基本方法 5
2.3 语音识别的主要技术 5
2.3.1 特征参数匹配法 5
2.3.2 隐马尔科夫法(HMM) 6
2.3.3 矢量量化(VQ) 6
2.3.4 神经网络法(ANN) 6
2.4 语音识别的关键技术 7
2.4.1 特征参数提取技术 7
2.4.2 模式匹配及模型训练技术 8
2.4.3 语音识别单元的选取 9
第三章 语音识别的难点和对策 10
3.1 语音识别的难点 10
3.2 语音识别系统的对策-DSP实现 11
第四章 语音识别现有技术及优劣 13
4.1 选择识别引擎应考虑的因素 13
4.2 IBM语音识别的基本原理 14
4.3 微软语音识别的基本原理 14
4.3 选择微软识别引擎的理由 16
第五章 英语培训软件总体设计 17
5.1 系统概述 17
5.2 主要模块和功能描述 17
5.3 系统特点 18
5.4 软、硬件平台及环境要求 19
5.4.1 硬件平台 19
5.4.2 软件平台 19
第六章 语音处理算法设计 20
6.1 总体设计 20
6.2 语音处理算法设计 24
6.3 算法特点 24
6.4 语音识别算法设计 24
6.4.1 基本思路 24
6.4.2 微软语音识别主要接口介绍 25
6.4.3 程序设计 28
6.4.4 实验结果 30
6.4.5 算法改进 33
6.5 波形比较算法分析与选择 34
6.5.1 概述 34
6.5.2 DP Matching算法 34
6.5.3 误差能量[16]算法 37
6.5.4 波形比较算法设计 37
第七章 实验结果与讨论 44
7.1 语音识别实验结果 44
7.2 波形比较实验结果 44
第八章 结论和改进建议 47
8.1 结论 47
8.2 改进建议 47
8.3 展望 48
参考文献 49
致 谢 50


参考文献
[1] 王炳锡,屈丹,彭煊. 实用语音识别基础(21世纪高等院校优秀教材). 国防工业出版社,2005.1
[2] 王小捷,常宝宝. 自然语言处理技术基础. 北京:北京邮电大学出版社,2002.12:50~101.
[3] 朱民雄.计算机语言技术.北京:北京航空航天大学出版社.1992.12(2):186~224.
[4] Sergios Theodoridis,Konstantinos . Pattern Recognition ,Second Edition . Elsevier Science,2003,9(2):208~253.
[5] Rabiner, L. Fundamentals of Speech Recognition,2005.