基于k-均值的基因选择方法的研究.doc
约37页DOC格式手机打开展开
基于k-均值的基因选择方法的研究,摘要基因芯片表达谱数据具有样本数量小、基因数量大等特点,且其中涵盖大量与疾病无关的基因,这不仅降低了分类器性能,还增加了计算复杂度。因此,对基因选择进行研究,不仅能提高分类器的性能,还能得到与疾病相关的特征基因子集,并且能提高人们对疾病的认识。本文利用k-均值聚类方法对备选基因进行初选,...
内容介绍
此文档由会员 那年三月 发布
基于k-均值的基因选择方法的研究
摘要
基因芯片表达谱数据具有样本数量小、基因数量大等特点,且其中涵盖大量与疾病无关的基因,这不仅降低了分类器性能,还增加了计算复杂度。因此,对基因选择进行研究,不仅能提高分类器的性能,还能得到与疾病相关的特征基因子集,并且能提高人们对疾病的认识。
本文利用K-均值聚类方法对备选基因进行初选,再对聚类簇的去冗余,然后利用粒子群优化算法(PSO)结合极端学习机(ELM)对初选基因进行筛选,该类方法能有效降低选出基因子集的冗余度并提高基因表达谱数据的分类准确。