关联规则数据挖掘方法在基因序列数据上的应用研究.doc

  
约30页DOC格式手机打开展开

关联规则数据挖掘方法在基因序列数据上的应用研究,1.3万字30页 原创作品,已通过查重系统摘要基因序列数据是一类重要的生物数据,这些数据为揭开生命奥秘提供了基础。后基因组时代的主要研究任务是研究基因序列数据并解读其含义。数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。典型的数据挖掘...
编号:99-1440246大小:271.00K
分类: 论文>计算机论文

内容介绍

此文档由会员 马甲线女神 发布

关联规则数据挖掘方法在基因序列数据上的应用研究

1.3万字 30页 原创作品,已通过查重系统


摘要基因序列数据是一类重要的生物数据,这些数据为揭开生命奥秘提供了基础。后基因组时代的主要研究任务是研究基因序列数据并解读其含义。数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。典型的数据挖掘包括聚类、分类、孤立点分析、关联规则、预测等。将数据挖掘技术应用于基因序列数据分析,已得到广泛关注和应用,并取得了研究成果。
本文主要介绍利用关联规则对基因序列数据进行挖掘。首先介绍了生物信息学,数据挖掘的相关知识。然后分析了关联规则两种常用的算法——Apriori算法和Fp-Growth算法。Apriori算法是关联规则常用的算法,然而效率有待改善。Fp-Growth算法改进了Apriori算法的缺点,是一种不产生频繁候选集的算法。最后编程实现两种算法对基因序列数据进行挖掘,并对同一数据库进行测试,以便直观的了解两种算法的效率。实验结果表明,Fp-Growth算法较Apriori算法有更高的效率。


关键词:基因序列数据 关联规则 Fp-Growth Apriori