基于weka数据挖掘工具的设计与开发--粗集分类算法的设计与实现.doc

约57页DOC格式手机打开展开

基于weka数据挖掘工具的设计与开发--粗集分类算法的设计与实现,摘 要随着大规模数据库和数据仓库的广泛应用,如何从海量数据中获取有用的知识成为研究的热点问题。数据挖掘(data mining,dm)的任务就是在如此海量的数据中提取有用的数据,它在商业方面的成功应用使得各种dm工具接踵而至。weka(怀卡托智能分析系统)是一种免费且开源的数据挖掘软件,它由新西兰怀卡托大学开发,功能强...
编号:45-166512大小:1.43M
分类: 论文>计算机论文

内容介绍

此文档由会员 li484167 发布

摘 要

随着大规模数据库和数据仓库的广泛应用,如何从海量数据中获取有用的知识成为研究的热点问题。数据挖掘(Data Mining,DM)的任务就是在如此海量的数据中提取有用的数据,它在商业方面的成功应用使得各种DM工具接踵而至。Weka(怀卡托智能分析系统)是一种免费且开源的数据挖掘软件,它由新西兰怀卡托大学开发,功能强大、方便使用,本课题将对Weka工具进行扩充开发。分类是数据挖掘的重要分支之一,而粗集理论为处理具有模糊、不精确或不完全信息的分类问题提供了一种新的工具。目前粗集理论已被应用于机器学习、故障诊断、关系数据库中知识获取等各种应用领域,并取得了很大成功。
本文介绍了数据挖掘相关知识、技术和算法以及数据挖掘工具Weka的相关知识。主要学习了粗集理论分类方法的基础,在理解粗集分类算法思想的基础上,把粗集分类应用到数据挖掘中。将粗集分类算法集成到数据挖掘工具Weka上,扩充了Weka系统的功能。

关键词:数据挖掘 分类 粗集 Weka
 
ABSTRACT
With the widespread use of large databases and data warehouse,How to acquire useful knowledge from large scale of data becomes study focus.The purpose of Data Mining(DM) is withdraw some useful information from a great deal of data,the successful of DM in the commercial application makes a lot of data mining tools emerged.Weka(Waikato Environment for Knowledge Analysis)is one kind of DM tool and we can get it free,it’s also an open-source tool.Weka was developed at the University of Waikato in New Zealand,it’s function is strong and you can easily using it,This assigment will extension develops Weka .classification is one of the important tasks in the field of data mining, Rough Set theory to deal with the fuzzy, inaccurate or incomplete information provided to the classification of a new tool.Now rough set theory has been used in machine learning, fault diagnosis, relational database access to knowledge and other areas of application,and achieved great success.
 This dissertation introduces Knowledge of DM and its relative technology as well as its programs,and the related knowledge of the data mining tools of Weka. Study of rough set theory based on the classification method, Set in understanding the rough classification algorithm on the basis of ideology And Set the rough classification applied to the data mining.And set the Rough Set classification algorithm based on expanded the data mining tools of Weka,Weka expansion of the system.

Key Words: Data mining,Classification, Rough Set,Weka
 
目 录
第一章 绪 论 - 1 -
1.1设计背景 - 1 -
1.2 数据挖掘工具在国内外应用及研究现状 - 1 -
1.2.1 数据挖掘工具的简述 - 1 -
1.2.2 国内外数据挖掘工具应用及研究现状 - 3 -
1.3 本文内容 - 6 -
1.4 设计成果 - 7 -
第二章 数据挖掘及方法的简介 - 8 -
2.1概述 - 8 -
2.2数据挖掘与知识发现 - 8 -
2.2.1 数据挖掘的过程 - 8 -
2.2.2 数据挖掘的任务 - 10 -
2.2.3 数据挖掘方法和技术 - 11 -
2.3 数据挖掘技术的应用 - 12 -
2.4本章小结 - 14 -
第三章 数据挖掘中的分类技术 - 15 -
3.1概述 - 15 -
3.2数据挖掘分类技术 - 15 -
3.2.1分类的基本概念 - 15 -
3.2.2典型分类方法 - 16 -
3.3 本章小结 - 18 -
第四章 粗集理论在分类问题中的应用 - 19 -
4.1概述 - 19 -
4.2经典粗集理论 - 19 -
4.2.1粗集的基本概念 - 19 -
4.2.2知识的约简与核 - 21 -
4.2.3知识的相对约简与相对核 - 21 -
4.2.4知识的依赖性 - 22 -
4.3信息观描述粗集 - 23 -
4.4粗集理论在分类问题中的应用 - 25 -
4.4.1数据集的粗集观描述 - 25 -
4.4.2属性约简 - 26 -
4.4.3基于属性重要性的启发式约简算法 - 26 -
4.4.4两种约简算法之比较 - 29 -
4.5基于粗集的分类方法 - 29 -
4.5.1基于属性约简和属性值约简的粗集分类方法 - 30 -
4.5.2另一种粗集分类方法 - 32 -
4.5.3两种分类方法之比较 - 33 -
4.6 基于粗集理论改进经典决策树算法 - 34 -
4.6.1经典的决策树学习算法 - 34 -
4.6.2基于属性重要性度量的多变量决策树构造算法 - 35 -
4.7 本章小结 - 36 -
第五章 基于Weka的分类模型实现 - 37 -
5.1概述 - 37 -
5.2基于Weka分类模型的设计 - 37 -
5.2.1 Weka系统简介 - 37 -
5.2.2对Weka系统进行扩充 - 41 -
5.3基于Weka分类模型的测试 - 45 -
5.4小结 - 49 -
结束语 - 50 -
致 谢 - 51 -
参考文献 - 52 -