从语音到拼音转换技术研究与设计.doc
约42页DOC格式手机打开展开
从语音到拼音转换技术研究与设计,from voice to pinyin conversion technology research and design1.7万字42页 原创作品,已通过查重系统摘要 随着人类科技的发展,人机交流已经成为人们对智能化迫切的追求。语音识别是人机交流的重要基础,越来越受到人们的关注。人们想...
内容介绍
此文档由会员 马甲线女神 发布
从语音到拼音转换技术研究与设计
From voice to Pinyin conversion technology research and design
1.7万字 42页 原创作品,已通过查重系统
摘要 随着人类科技的发展,人机交流已经成为人们对智能化迫切的追求。语音识别是人机交流的重要基础,越来越受到人们的关注。人们想要与机器顺畅的交流,就要求机器对连续语句的准确识别,还要能够排除口语化,噪音干扰等问题。但是语音识别在现在的技术还不成熟,大词量的连续语音识别效率还是比较低,对于这种情况语音识别系统都不能很好的解决。
为了解决大词量和语音连续性的难题,本文对基于拼音音元的语音识别系统
进行研究,在声韵母语音识别系统的基础上进一步对识别单元进行细化,使用已
有的一些成熟的语音识别技术,结合本文提出的语音音元分割方法和语音语义识
别分离的架构形成一种全新的语音识别系统框架,本文使用的分析软件主要是使用cooledit pro2.0分析音频。
本论文介绍了语音识别研究的现状,研究的困难,语音识别的应用领域以及发展前景。在第二章介绍了语音样本的采集和预处理,主要包括预滤波、采样与量化、预加重、加窗、音量标准化等。第三章主要介绍汉语拼音的历史,语法,声韵母的分类。第四章中介绍语音信号在时域和频域所表现出的不同特性,提出一种基于波形图、语谱图与共振峰相结合识别音频中的字符。该算法首先将语音信号转换成时域波形图,应用形态学图像处理技术对波形图进行分析,进行预处理,然后利用相关图像算法对处理后的波形图进行互相关运算。对样本进行逐帧识别。利用共振峰和语谱图的特性对样本进行识别,突出共振峰的时域性,第五章提出音元分割方法,其主要利用声韵母分离,剥离韵母后,研究韵母的波形,分析出词语的音调,然后建立出语库,根据样本的特征值匹配词库。
本文通过对基于拼音音元的语音识别系统的研究,为语音识别建立了一种语音识别与语义转换分离的架构,为大词量的语音连续语音实时识别技术提供了一种新的解决思路。
关键词:语音识别 音元 声韵母分离 共振峰 波形图 语谱图
From voice to Pinyin conversion technology research and design
1.7万字 42页 原创作品,已通过查重系统
摘要 随着人类科技的发展,人机交流已经成为人们对智能化迫切的追求。语音识别是人机交流的重要基础,越来越受到人们的关注。人们想要与机器顺畅的交流,就要求机器对连续语句的准确识别,还要能够排除口语化,噪音干扰等问题。但是语音识别在现在的技术还不成熟,大词量的连续语音识别效率还是比较低,对于这种情况语音识别系统都不能很好的解决。
为了解决大词量和语音连续性的难题,本文对基于拼音音元的语音识别系统
进行研究,在声韵母语音识别系统的基础上进一步对识别单元进行细化,使用已
有的一些成熟的语音识别技术,结合本文提出的语音音元分割方法和语音语义识
别分离的架构形成一种全新的语音识别系统框架,本文使用的分析软件主要是使用cooledit pro2.0分析音频。
本论文介绍了语音识别研究的现状,研究的困难,语音识别的应用领域以及发展前景。在第二章介绍了语音样本的采集和预处理,主要包括预滤波、采样与量化、预加重、加窗、音量标准化等。第三章主要介绍汉语拼音的历史,语法,声韵母的分类。第四章中介绍语音信号在时域和频域所表现出的不同特性,提出一种基于波形图、语谱图与共振峰相结合识别音频中的字符。该算法首先将语音信号转换成时域波形图,应用形态学图像处理技术对波形图进行分析,进行预处理,然后利用相关图像算法对处理后的波形图进行互相关运算。对样本进行逐帧识别。利用共振峰和语谱图的特性对样本进行识别,突出共振峰的时域性,第五章提出音元分割方法,其主要利用声韵母分离,剥离韵母后,研究韵母的波形,分析出词语的音调,然后建立出语库,根据样本的特征值匹配词库。
本文通过对基于拼音音元的语音识别系统的研究,为语音识别建立了一种语音识别与语义转换分离的架构,为大词量的语音连续语音实时识别技术提供了一种新的解决思路。
关键词:语音识别 音元 声韵母分离 共振峰 波形图 语谱图