基于trigger模型的音频检索研究.doc

  
约49页DOC格式手机打开展开

基于trigger模型的音频检索研究,2.64万字 49页 原创作品,已通过查重系统摘要传统的音乐检索基本上是基于歌名、歌手、歌词中的关键词等从曲库中检索出符合条件的音乐作品。在基于内容的音乐检索技术的研究中,通常考虑音乐的节奏、音色、音高、强度等物理特征作为内容进行匹配检索,由于这些特征过于专业化,很难得到用户的接受。...
编号:99-583416大小:893.00K
分类: 论文>通信/电子论文

内容介绍

此文档由会员 第二波打卡 发布

基于trigger模型的音频检索研究


2.64万字 49页 原创作品,已通过查重系统


摘 要
传统的音乐检索基本上是基于歌名、歌手、歌词中的关键词等从曲库中检索出符合条件的音乐作品。在基于内容的音乐检索技术的研究中,通常考虑音乐的节奏、音色、音高、强度等物理特征作为内容进行匹配检索,由于这些特征过于专业化,很难得到用户的接受。Web2.0的发展提供了用户自由行为,用户可以通过自己对音乐的理解定义标签,不同的标签从不同角度诠释着用户对音乐的理解。标签之间就存在trigger关系,即触发关系。
本文主要研究的是语义标签的trigger检索问题,将标签互相关联,利用最大熵原理来搭建trigger模型,利用trigger模型,即触发对,有“强标签”(触发标签)和“弱标签”(被触发标签),若“强标签”(触发标签)标注了一首歌曲,则能够提高“弱标签”(被触发标签)标注这首歌曲的概率。标签标注歌曲是利用自动语义标注技术实现的,最大熵原理是一种选择随机变量统计特性最符合客观情况的准则。一个标签可与多个标签相关联,那么这多个标签对于这一个标签来说就拥有了随机变量统计特性,但是符合上述条件的分布有多种,通常,其中有一种分布熵最大。选用此种熵最大的分布作为该随机变量的分布,是一种有效的处理方法和准则,当我们利用最大熵原理构建好trigger标签以后,一首歌就能被多个标签准确的标注了,这样能够方便更加方便用户检索到自己想要的歌曲。
本文着重介绍里用最大熵原理搭建trigger模型,使用trigger模型加强标签间的相互关联性,通过“强标签”改善“弱标签”的标注概率,增强标签标注歌曲的准确率,并对标签标注的准确率进行了实验检测,通过实验结果证明了此方法的可行性。



【关键词】最大熵原理;trigger模型;自动语义标注;触发对;标签