基于遗传算法的聚类分析研究.doc

约4页DOC格式手机打开展开

基于遗传算法的聚类分析研究,本文共4页,3189字摘 要:聚类分析对于模式识别尤其是手写体汉字识别有着重要的作用和影响,聚类分析过程本质上是一种无监督学习的最优解求解过程。遗传算法是一种用于搜索最优解的方法。本文结合遗传算法的优势和传统的统计模式识别理论,提出一种基于遗传算法的聚类分析算法。关键词:遗传算法,统计模式识别...
编号:5-24177大小:74.50K
分类: 论文>生物/化学论文

内容介绍

此文档由会员 王兴云 发布

基于遗传算法的聚类分析研究

本文共4页,3189字

摘 要:聚类分析对于模式识别尤其是手写体汉字识别有着重要的作用和影响,聚类分析过程本质上是一种无监督学习的最优解求解过程。遗传算法是一种用于搜索最优解的方法。本文结合遗传算法的优势和传统的统计模式识别理论,提出一种基于遗传算法的聚类分析算法。

关键词:遗传算法,统计模式识别,聚类分析

英文摘要:Clustering analysis is very important and effective to pattern recognition especially handwrittern character recognition. Clustering analysis process who’s essence is a unsupervise studying process to search for optimal result. Genetic algoritm is a method of searching for optimal result. The article combining advantage of genetic algoritm and theory of traditional statistical pattern recognition, prsent a clustering analysis algoritm based on genetic algoritm.
key words:genetic algoritm;statistical pattern recognition;clustering analysis

1. 引言
模式识别属于当代高科技研究的重要领域,已经发展为一门独立的新学科。模式识别技术迅速扩展,已经广泛应用于国民经济、国防建设和社会发展等很多方面,在汉字识别领域也有着广泛的应用。然而,汉字种类众多,常用的汉字大概有2000多个,而且一个汉字由于字体和大小不一样可以产生多个模式,对于手写体的汉字,模式种类可能会更多。对于这样庞大的模式集合,如果不研究策略,直接对待识别模式进行识别将要花费大量的时间和计算量。于是,用聚类方法按照某种相似性度量将模式中相似性很高的归为一类,例如:“己”和“已”的结构特征相似性很高。当识别未知模式时,可以将未知模式与和它相似性最高的类进行匹配,而不必和所有的模式进行匹配,大大的缩小了识别的目标范围。本文的目的就是研究一种新的聚类算法,使其能对一群模式在非监督的情况下进行有效的分类,为手写体的汉字模式识别做好预处理工作。
参考文献
1.J. C. Bezdek, J. Keller, R. Krisnapuram,and N. R. Pal. Fuzzy Models and Algorithms
for Pattern Recognition and Image Processing. Kluwer Academic Publishers, 1999.
2.J H Holland. Genetic algorithm[J] Scientific American,Apr.1992
3.Y. Yoshinari, W. Pedrycz, and K. Hirota. Construction of fuzzy models through clustering techniques. Fuzzy Sets and Systems, 54:157–165,1993.
4.Xuejian Xiong,Kap Luk Chan,Kian Lee Tan.Similarity-Driven Cluster Merging Method for Unsupervised Fuzzy Clustering,UAI.2004.