语音信号的共振峰估计.doc

  
约44页DOC格式手机打开展开

语音信号的共振峰估计,1.8万字44页 包括外文翻译,原创作品,已通过查重系统摘要在人类的说话时产生的语音信号的频谱中,会出现某些特定的区域。在这些区域中有个很明显的特征,就是区域内的能量密度要比区域外部的高得多。而这些高能量密度区域被称为共振峰区域。共振峰是一种声音的物理特征,它反映的是声音信号中的某些部分,主要是指浊...
编号:99-583568大小:825.00K
分类: 论文>通信/电子论文

内容介绍

此文档由会员 红提很好吃 发布

语音信号的共振峰估计

1.8万字 44页 包括外文翻译,原创作品,已通过查重系统


摘要

在人类的说话时产生的语音信号的频谱中,会出现某些特定的区域。在这些区域中有个很明显的特征,就是区域内的能量密度要比区域外部的高得多。而这些高能量密度区域被称为共振峰区域。
共振峰是一种声音的物理特征,它反映的是声音信号中的某些部分,主要是指浊音中的元音部分在一个特定的频谱区间内所显示出来的强谐振特性。共振峰的参数之中,一般以共振峰频率和共振峰带宽为最主要参数。共振峰的频率的提取是这些年以来一直较为热门的一个话题。共振峰之所以能在声学模型中占有如此举足轻重的地位,与它的所展现出来的物理性质是密不可分的。
就如同每个人都有一个独一无二的身份表示一样,声音信号(尤其是人类发出的语音信号)也一样有着自己的身份证。如果说,一个人的指纹是唯一确定一个人的标志的话;那么,语音信号的共振峰结构就相当于语音信号的“指纹”。一旦掌握了提取这种声学“指纹”的方法,就相当于找到了另一种确定人的身份的方法。因为不同的声音(主要是浊音)的共振峰频率分布范围不一样,而且,即便是同一个音,由不同的人来读出来,会因为每个人的声带结构的不同,造成最后的共振峰结构不同,这点被可以严格证明出来。
然而,要提取出一段声音信号的共振峰结构绝不是一件容易的事,仅从最基本的提取工作来看,就有不少障碍,再加上后续的处理,要想完整得得出理想的谱线,是要花费不少精力的。想要得知如何取出比较纯净的共振峰频谱,就要从最基本的信号的时域和频域分析做起。以此为根基,衍生出了多种更高阶的分析法,比如倒频域分析法和线性预测。这也是本文阐述的主要方法。



关键词:共振峰,线性预测,LPC倒谱