语音软件的应用和开发设计.rar
语音软件的应用和开发设计,页数70页 字数 4.1万字注意本论文包含完整的毕业论文_扉页.doc 毕业设计_目录.doc 毕业设计_摘要.doc 毕业设计_正文.doc 毕业设计_翻译和开题报告毕业设计_任务书 还包括能运行的本论文开发实现的源程序摘要计算机语音技术是语音领域的一个重要部分,包括四种技术,即语音分析技术、...
该文档为压缩文件,包含的文件列表如下:
内容介绍
原文档由会员 云贝贝 发布
语音软件的应用和开发设计
页数 70页 字数 4.1万字
注意 本论文包含完整的毕业论文_扉页.doc
毕业设计_目录.doc
毕业设计_摘要.doc
毕业设计_正文.doc
毕业设计_翻译和开题报告
毕业设计_任务书
还包括能运行的本论文开发实现的源程序
摘 要
计算机语音技术是语音领域的一个重要部分,包括四种技术,即语音分析技术、语音存储与再生技术、语音合成技术和语音识别技术。语音合成技术是利用计算机一类机器,按人们预定的程序和指令,人为地产生出音素、音节、词和句子的技术。语音合成技术不但可以用于人——机——人通信系统,而且也是语音学研究的一种重要手段,对于揭示语音产生和语言感知机制具有重要意义。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高级技术。这一技术的应用将从根本上改变计算机的人机界面,从而对计算机的发展以及推广应用产生深远的影响。综上所述,研究和探讨计算机语音技术这一课题具有深远的理论意义和广泛的应用前景。
本文详细介绍了计算机语音技术的两大分支──语音合成和语音识别技术。通过对其发展历史的回顾和其原理的论述,分析了语音合成和语音识别中的关键技术,并指出语音技术在现实生活中各个领域的应用,以及目前的语音系统所存在的缺陷和今后的发展方向。在论述计算机语音技术原理的基础上,作者对微软公司的语音软件开发包Microsoft Speech SDK5.1进行了研究,并且总结了利用该开发包基于VC++6.0实现文本¬¬──语音转换系统(Text-to-Speech, TTS)和语音识别系统(Speech Recognition)的具体过程。通过对以上理论的研究和探索,作者设计开发了一个功能较齐全的语音软件,它具有文本¬¬¬──语音转换、语音校对、将文本内容保存为wav文件、语音录入等功能,并有良好的人机交互界面。
关键词:计算机语音技术;语音合成;语音识别;组件对象模型(COM)
目 录
1 绪论 …………….……………………………………………………………….. 1
1.1 语音技术概述 ……………………………………………………………………...1
1.2 研究语音技术的重要意义 ………………………………………….……………2
2 语音技术的基础知识 …………………………………………………………... 4
2.1 发音的生理机构与过程 ………………………………………………………….4
2.1.1 发音的生理机构 ……………………………………………………………. 4
2.1.2 语音的产生过程 ……………………………………………………………..4
2.1.3 语音分类 ………………………………………………………………………5
2.2 语音的基本特性 ………………………………………………………………… 6
2.2.1 语音的物理属性 ……………………………………………………………..6
2.2.2 汉语语音基础及其特性 ……………………………………………………6
2.2.3 语音的波形特征 ……………………………………………………………..8
2.2.4 语音的频谱特性 ……………………………………………………………..9
2.2.5 语音的音律特性 ……………………………………………………………12
3 语音合成技术 …………………………………………………………………..13
3.1 语音合成技术简介 ……………………………………………………………. 13
3.1.1 语音合成概述 ………………………………………………………………13
3.1.2 国内外语音合成技术的发展情况 ………………………………………13
3.2 语音合成原理 …………………………………………………………………….14
3.2.1 共振峰合成 ………………………………………………………………….15
3.2.2 LPC参数 ……………………………………………………………………...17
3.2.3 PSOLA合成技术 ……………………………………………………………17
3.2.4 LMA声道模型 ………………………………………………………………18
3.3 文本──语音转换系统(Text to Speech, TTS) ……………………………19
3.3.1 TTS的发展 …………………………………………………………………..19
3.3.2 TTS的组成部分 …………………………………………………………….21
3.3.3 TTS的典型应用 …………………………………………………………….23
3.4 语音合成发展方向 ………………………………………………………………25
4 语音识别技术 ………………………………………………………………….27
4.1 语音识别技术简介 ………………………………………………………………27
4.1.1语音识别概述 ……………………………………………………………….27
4.1.2国内外语音识别技术的发展情况 ……………………………………….29
4.2 语音识别的定义、原理和分类 …………………………………………………30
4.2.1 语音识别的定义 ……………………………………………………………30
4.2.2 语音识别的基本原理 ……………………………………………………...30
4.2.3 语音识别的分类 ……………………………………………………………31
4.3 语音识别的关键技术 ………………………………………………………….32
4.3.1 语音识别单元的选取 ……………………………………………………...33
4.3.2 特征参数提取技术 ………………………………………………………...33
4.3.3 模式匹配及模型训练技术 ……………………………………………….34
4.4 语音识别的应用及发展趋势 …………………………………………………34
4.4.1 语音识别的应用 ……………………………………………………………34
4.4.2 语音识别的发展趋势 ……………………………………………………...35
5 语音软件的设计和开发 ………………………………………………………..38
5.1 COM简介 ………………………………………………………………………..38
5.1.1 COM定义及COM接口 …………………………………………………..38
5.1.2 COM的基本概念 …………………………………………………………...39
5.1.3 COM对象的使用和处理 ………………………………………………….40
5.1.4 基本接口—─IUnknown ……………………………………..………….43
5.1.5 Unicode串处理 ……………………………………………………………...44
5.2 关于Microsoft Speech SDK5.1 ……………………………………………….46
5.2.1文本—语音转换API (API for Text-to-Speech) ………………………47
5.2.2 语音识别API (API for Speech Recognition)………………………47
5.3 用VC++实现TTS和SR的过程 ……………………………………………..48
5.3.1 实现TTS的过程 ……………………………………………………………48
5.3.2 实现SR的过程 ……………………………………………………………..52
5.3.3 系统分析和测试 ……………………………………………………………54
6 结论 ……………………………………………………………………………..65
致谢
参考文献
参考文献
[1] 朱民雄,闻新,黄健群,周露.计算机语音技术.北京:北京航空航天大学出版社,2002年1月第一版.
[2] 张成海,张铎.现代自动识别技术与应用.北京:清华大学出版社,2003年4月第一版.
[3] 康博创作室.Visual C++60 高级编程.北京:清华大学出版社,1997年7月第一版.
[4] Kate Gregory.Visual C++6 开发使用手册. 机械工业出版社,1992年2月第一版.
[5] 余英,梁刚. Visual C++ 实践与提高—COM和COM+篇.中国铁道出版社,2001年2月第一版
[6] 潘爱民.COM原理与应用.北京:清华大学出版社,1999年11月第一版.
[7] Gregory Brill. 精通COM+[M].机械工业出版社, 黄志军,任雄伟,刘启忠等译.2002年9月第一版.
[8] DON BOX.COM本质论(Essential COM).中国电力出版社,潘爱民译,2001年8月第一版.
[9] 宋阳.利用SAPI5.0进行语素分解
[10] 约翰•斯万科著,徐颍译.COM编程精彩实例.中国电力出版社.2001年6月第一版.
[11] 李逸波,郭天杰,王华驹.最新语音识别技术.北京:电子工业出版社,1998
[12] 安居院猛,中嵨正之.计算机语音处理(日).北京:国防工业出版社,1987
[13] 陈永彬.语音信号处理.上海:上海交通大学出版社,1990
[14] 岳东剑,等.应用小波分析技术进行汉语语音基音频率分析的研究.模式识别与人工智能.2000.13(2):235~237
页数 70页 字数 4.1万字
注意 本论文包含完整的毕业论文_扉页.doc
毕业设计_目录.doc
毕业设计_摘要.doc
毕业设计_正文.doc
毕业设计_翻译和开题报告
毕业设计_任务书
还包括能运行的本论文开发实现的源程序
摘 要
计算机语音技术是语音领域的一个重要部分,包括四种技术,即语音分析技术、语音存储与再生技术、语音合成技术和语音识别技术。语音合成技术是利用计算机一类机器,按人们预定的程序和指令,人为地产生出音素、音节、词和句子的技术。语音合成技术不但可以用于人——机——人通信系统,而且也是语音学研究的一种重要手段,对于揭示语音产生和语言感知机制具有重要意义。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高级技术。这一技术的应用将从根本上改变计算机的人机界面,从而对计算机的发展以及推广应用产生深远的影响。综上所述,研究和探讨计算机语音技术这一课题具有深远的理论意义和广泛的应用前景。
本文详细介绍了计算机语音技术的两大分支──语音合成和语音识别技术。通过对其发展历史的回顾和其原理的论述,分析了语音合成和语音识别中的关键技术,并指出语音技术在现实生活中各个领域的应用,以及目前的语音系统所存在的缺陷和今后的发展方向。在论述计算机语音技术原理的基础上,作者对微软公司的语音软件开发包Microsoft Speech SDK5.1进行了研究,并且总结了利用该开发包基于VC++6.0实现文本¬¬──语音转换系统(Text-to-Speech, TTS)和语音识别系统(Speech Recognition)的具体过程。通过对以上理论的研究和探索,作者设计开发了一个功能较齐全的语音软件,它具有文本¬¬¬──语音转换、语音校对、将文本内容保存为wav文件、语音录入等功能,并有良好的人机交互界面。
关键词:计算机语音技术;语音合成;语音识别;组件对象模型(COM)
目 录
1 绪论 …………….……………………………………………………………….. 1
1.1 语音技术概述 ……………………………………………………………………...1
1.2 研究语音技术的重要意义 ………………………………………….……………2
2 语音技术的基础知识 …………………………………………………………... 4
2.1 发音的生理机构与过程 ………………………………………………………….4
2.1.1 发音的生理机构 ……………………………………………………………. 4
2.1.2 语音的产生过程 ……………………………………………………………..4
2.1.3 语音分类 ………………………………………………………………………5
2.2 语音的基本特性 ………………………………………………………………… 6
2.2.1 语音的物理属性 ……………………………………………………………..6
2.2.2 汉语语音基础及其特性 ……………………………………………………6
2.2.3 语音的波形特征 ……………………………………………………………..8
2.2.4 语音的频谱特性 ……………………………………………………………..9
2.2.5 语音的音律特性 ……………………………………………………………12
3 语音合成技术 …………………………………………………………………..13
3.1 语音合成技术简介 ……………………………………………………………. 13
3.1.1 语音合成概述 ………………………………………………………………13
3.1.2 国内外语音合成技术的发展情况 ………………………………………13
3.2 语音合成原理 …………………………………………………………………….14
3.2.1 共振峰合成 ………………………………………………………………….15
3.2.2 LPC参数 ……………………………………………………………………...17
3.2.3 PSOLA合成技术 ……………………………………………………………17
3.2.4 LMA声道模型 ………………………………………………………………18
3.3 文本──语音转换系统(Text to Speech, TTS) ……………………………19
3.3.1 TTS的发展 …………………………………………………………………..19
3.3.2 TTS的组成部分 …………………………………………………………….21
3.3.3 TTS的典型应用 …………………………………………………………….23
3.4 语音合成发展方向 ………………………………………………………………25
4 语音识别技术 ………………………………………………………………….27
4.1 语音识别技术简介 ………………………………………………………………27
4.1.1语音识别概述 ……………………………………………………………….27
4.1.2国内外语音识别技术的发展情况 ……………………………………….29
4.2 语音识别的定义、原理和分类 …………………………………………………30
4.2.1 语音识别的定义 ……………………………………………………………30
4.2.2 语音识别的基本原理 ……………………………………………………...30
4.2.3 语音识别的分类 ……………………………………………………………31
4.3 语音识别的关键技术 ………………………………………………………….32
4.3.1 语音识别单元的选取 ……………………………………………………...33
4.3.2 特征参数提取技术 ………………………………………………………...33
4.3.3 模式匹配及模型训练技术 ……………………………………………….34
4.4 语音识别的应用及发展趋势 …………………………………………………34
4.4.1 语音识别的应用 ……………………………………………………………34
4.4.2 语音识别的发展趋势 ……………………………………………………...35
5 语音软件的设计和开发 ………………………………………………………..38
5.1 COM简介 ………………………………………………………………………..38
5.1.1 COM定义及COM接口 …………………………………………………..38
5.1.2 COM的基本概念 …………………………………………………………...39
5.1.3 COM对象的使用和处理 ………………………………………………….40
5.1.4 基本接口—─IUnknown ……………………………………..………….43
5.1.5 Unicode串处理 ……………………………………………………………...44
5.2 关于Microsoft Speech SDK5.1 ……………………………………………….46
5.2.1文本—语音转换API (API for Text-to-Speech) ………………………47
5.2.2 语音识别API (API for Speech Recognition)………………………47
5.3 用VC++实现TTS和SR的过程 ……………………………………………..48
5.3.1 实现TTS的过程 ……………………………………………………………48
5.3.2 实现SR的过程 ……………………………………………………………..52
5.3.3 系统分析和测试 ……………………………………………………………54
6 结论 ……………………………………………………………………………..65
致谢
参考文献
参考文献
[1] 朱民雄,闻新,黄健群,周露.计算机语音技术.北京:北京航空航天大学出版社,2002年1月第一版.
[2] 张成海,张铎.现代自动识别技术与应用.北京:清华大学出版社,2003年4月第一版.
[3] 康博创作室.Visual C++60 高级编程.北京:清华大学出版社,1997年7月第一版.
[4] Kate Gregory.Visual C++6 开发使用手册. 机械工业出版社,1992年2月第一版.
[5] 余英,梁刚. Visual C++ 实践与提高—COM和COM+篇.中国铁道出版社,2001年2月第一版
[6] 潘爱民.COM原理与应用.北京:清华大学出版社,1999年11月第一版.
[7] Gregory Brill. 精通COM+[M].机械工业出版社, 黄志军,任雄伟,刘启忠等译.2002年9月第一版.
[8] DON BOX.COM本质论(Essential COM).中国电力出版社,潘爱民译,2001年8月第一版.
[9] 宋阳.利用SAPI5.0进行语素分解
[10] 约翰•斯万科著,徐颍译.COM编程精彩实例.中国电力出版社.2001年6月第一版.
[11] 李逸波,郭天杰,王华驹.最新语音识别技术.北京:电子工业出版社,1998
[12] 安居院猛,中嵨正之.计算机语音处理(日).北京:国防工业出版社,1987
[13] 陈永彬.语音信号处理.上海:上海交通大学出版社,1990
[14] 岳东剑,等.应用小波分析技术进行汉语语音基音频率分析的研究.模式识别与人工智能.2000.13(2):235~237