基于半监督学习方法的研究.doc
基于半监督学习方法的研究,12700字 22页摘 要 近几年来随着机器学习在数据分析和数据挖掘中的广泛应用,半监督学习的理论研究成果已经部分应用于实际问题的解决。半监督学习(semi-supervised learning)是模式识别和机器学习中的重要研究领域,一直为国际机器学习界所广泛关注。本文主要研究了半监督学习方法...
内容介绍
此文档由会员 csfujixie 发布基于半监督学习方法的研究
12700字 22页
摘 要
近几年来随着机器学习在数据分析和数据挖掘中的广泛应用,半监督学习的理论研究成果已经部分应用于实际问题的解决。半监督学习(Semi-supervised Learning)是模式识别和机器学习中的重要研究领域,一直为国际机器学习界所广泛关注。
本文主要研究了半监督学习方法,具体考虑了不同度量对半监督学习的影响。考虑关于标记的和未标记数据的一般问题的学习,其通常被称为半监督学习或转导推理。半监督学习的原则性方法是定义一个有关标记的和未标记的点集的固有结构所共同显现的足够平稳的分类函数。实验结果表明,使用指数度量的GCM算法的性能最优,而使用欧几里得度量的GCM算法的性能最差;另外,不同度量中的参数取值对算法的性能具有一定的影响。
关键词:半监督 机器学习 GCM CM
ABSTRCAT
With Machine learning methods being widely applied for real world data analysis and data mining, semi-supervised learning has been introduce for solving more and more real world problems.Semi-supervised learning, which combines information from both labeled and unlabeled data for learning tasks, has drawn wide attention.
We consider the general problem of learning from labeled and unlabeled data,which is often called semi-supervised learning or transductive inference.A principled approach to semi-supervised learning is to design a classifying function which is suf_ciently smooth with respect to the intrinsic structure collectively revealed by known labeled and unlabeled points. Experimental results show that performance of GCM algorithm for using the exponential measure is superior to other measures and performance of GCM algorithm for using the Euclidean measure is inferior to other measures. Moreover, arguments for different measures impact on the performance of algorithm.
Key words:Semi-supervised Machine learing GCM CM
目 录
一 引言 1
1.1研究背景和意义 1
1.1.1研究背景 1
1.1.2研究意义 1
1.2国内外研究现状 1
1.3研究内容 2
1.4论文组织与安排 2
二 半监督学习算法 3
2.1朴素贝叶斯分类器 3
2.1.1贝叶斯法则 3
2.2.2 朴素贝叶斯分类器学习 3
2.2 k-近邻算法 4
三 常用的度量方法 6
3.1加权s阶Minkowski度量 6
3.2非线性度量 6
3.3 K近邻度量 6
3.4指数度量 6
3.5双曲正切度量 7
四 基于核策略的半监督学习算法 8
4.1 CM算法 8
4.2 GCM算法 8
五 总体设计与详细设计 10
5.1总体设计 10
5.2 详细设计 10
六 实验研究与分析 13
6.1实验数据 13
6.1.1 CM算法实验数据 13
6.1.2 GCM算法实验数据 14
6.2实验方法 14
6.2.1 CM实验方法 14
6.2.2 GCM实验方法 14
6.3 实验结果与分析 15
七 结论 17
谢 辞 18
参考文献 19