【毕业论文】利用hmm技术实现基于文本相关的语音识别设计.doc
约59页DOC格式手机打开展开
【毕业论文】利用hmm技术实现基于文本相关的语音识别设计,论文标准word格式排版 59页摘要语音识别作为一个交叉学科,具有深远的研究价值。语音识别和语音合成技术已经成为现代技术发展的一个标志,也是现代计算机技术研究和发展的一个重要领域。虽然语音识别技术已经取得了一些成就,也有部分产品面世,但是,大多数语音识别系统仍局限于实验室,远没有达到实用化要求。制约实用化的根本原因可以...
内容介绍
此文档由会员 莎士比亚 发布
论文标准WORD格式排版 59页
摘要
语音识别作为一个交叉学科,具有深远的研究价值。语音识别和语音合成技术已经成为现代技术发展的一个标志,也是现代计算机技术研究和发展的一个重要领域。虽然语音识别技术已经取得了一些成就,也有部分产品面世,但是,大多数语音识别系统仍局限于实验室,远没有达到实用化要求。制约实用化的根本原因可以归为两类,识别精度和系统复杂度。
HMM是一种用参数表示的用于描述随机过程统计特性的概率模型,它是由马尔可夫链演变来的,所以它是基于参数模型的统计识别方法。它是一个双重随机过程——具有一定状态数的隐马尔可夫链和显示随机函数集,每个函数都与链中一个状态相关联。“隐”的过程通过显示过程所产生的观察符号序列来表示,这就是隐马尔可夫模型。
本文主要介绍了语音识别的预处理,隐马尔可夫模型(Hidden Markov Models,HMM)和语音识别的基础理论和发展方向。对数字0~9的识别进行了详细的Matlab语言实现。
关键词:HMM;文本相关;语音识别
摘 要 I
ABSTRACT II
第一章 绪论 1
1.1 背景、目的和意义 1
1.2 发展历史和国内外现状 1
1.3 语音识别系统概述 3
1.3.1语音识别系统构成 3
1.3.2语音识别的分类 4
1.3.3 识别方法介绍 5
第二章 语音信号的预处理及特征提取 8
2.1 语音信号的产生模型 9
2.2 语音信号的数字化和预处理 9
2.2.1 语音采样 10
2.2.2 预加重…………………………………………………………………..10
2.2.3 语音信号分帧加窗 11
2.3 端点检测 13
2.3.1 短时能量 13
2.3.2 短时平均过零率 14
2.3.3 端点检测——“双门限”算法 15
2.4 语音信号特征参数的提取 16
2.4.1线性预测倒谱系数LPCC 16
2.4.2 Mel倒谱系数MFCC 17
2.4.3 LPCC系数和MFCC系数的比较………………………………………18
第三章 隐马尔可夫模型(HMM) 20
3.1 隐马尔可夫模型 20
3.1.1 隐马尔可夫(HMM)基本思想 20
3.1.2 语音识别中的HMM 24
3.1.3 隐马尔可夫的三个基本问题[10] 24
3.1.4 HMM的基本算法 25
3.2 HMM模型的一些问题 28
3.2.1 HMM溢出问题的解决方法 28
3.2.2 参数的初始化问题 29
3.2.3提高HMM描述语音动态特性的能力 31
3.2.4直接利用状态持续时间分布概率的HMM系统 31
第四章 基于文本相关的语音识别 33
4.1 引言 33
4.2 HMM模型的语音实现方案 33
4.2.1初始模型参数设定 34
4.2.2 HMM模型状态分布B的估计 34
4.2.3 多样本训练 35
4.2.4 识别过程 36
4.3 仿真过程及系统评估 37
4.3.1 语音数据的采集及数据库的建立 37
4.3.2 仿真实验——HMM用于语音识别 38
4.3.3 Matlab编程实现 40
4.4系统仿真中的若干问题 43
总结展望 44
参考文献 45
附 录 46
致 谢 54
摘要
语音识别作为一个交叉学科,具有深远的研究价值。语音识别和语音合成技术已经成为现代技术发展的一个标志,也是现代计算机技术研究和发展的一个重要领域。虽然语音识别技术已经取得了一些成就,也有部分产品面世,但是,大多数语音识别系统仍局限于实验室,远没有达到实用化要求。制约实用化的根本原因可以归为两类,识别精度和系统复杂度。
HMM是一种用参数表示的用于描述随机过程统计特性的概率模型,它是由马尔可夫链演变来的,所以它是基于参数模型的统计识别方法。它是一个双重随机过程——具有一定状态数的隐马尔可夫链和显示随机函数集,每个函数都与链中一个状态相关联。“隐”的过程通过显示过程所产生的观察符号序列来表示,这就是隐马尔可夫模型。
本文主要介绍了语音识别的预处理,隐马尔可夫模型(Hidden Markov Models,HMM)和语音识别的基础理论和发展方向。对数字0~9的识别进行了详细的Matlab语言实现。
关键词:HMM;文本相关;语音识别
摘 要 I
ABSTRACT II
第一章 绪论 1
1.1 背景、目的和意义 1
1.2 发展历史和国内外现状 1
1.3 语音识别系统概述 3
1.3.1语音识别系统构成 3
1.3.2语音识别的分类 4
1.3.3 识别方法介绍 5
第二章 语音信号的预处理及特征提取 8
2.1 语音信号的产生模型 9
2.2 语音信号的数字化和预处理 9
2.2.1 语音采样 10
2.2.2 预加重…………………………………………………………………..10
2.2.3 语音信号分帧加窗 11
2.3 端点检测 13
2.3.1 短时能量 13
2.3.2 短时平均过零率 14
2.3.3 端点检测——“双门限”算法 15
2.4 语音信号特征参数的提取 16
2.4.1线性预测倒谱系数LPCC 16
2.4.2 Mel倒谱系数MFCC 17
2.4.3 LPCC系数和MFCC系数的比较………………………………………18
第三章 隐马尔可夫模型(HMM) 20
3.1 隐马尔可夫模型 20
3.1.1 隐马尔可夫(HMM)基本思想 20
3.1.2 语音识别中的HMM 24
3.1.3 隐马尔可夫的三个基本问题[10] 24
3.1.4 HMM的基本算法 25
3.2 HMM模型的一些问题 28
3.2.1 HMM溢出问题的解决方法 28
3.2.2 参数的初始化问题 29
3.2.3提高HMM描述语音动态特性的能力 31
3.2.4直接利用状态持续时间分布概率的HMM系统 31
第四章 基于文本相关的语音识别 33
4.1 引言 33
4.2 HMM模型的语音实现方案 33
4.2.1初始模型参数设定 34
4.2.2 HMM模型状态分布B的估计 34
4.2.3 多样本训练 35
4.2.4 识别过程 36
4.3 仿真过程及系统评估 37
4.3.1 语音数据的采集及数据库的建立 37
4.3.2 仿真实验——HMM用于语音识别 38
4.3.3 Matlab编程实现 40
4.4系统仿真中的若干问题 43
总结展望 44
参考文献 45
附 录 46
致 谢 54