文本分类系统的设计与实现.doc
约38页DOC格式手机打开展开
文本分类系统的设计与实现,摘要 分类是数据挖掘中一项非常重要的任务,在现实生活中有着广泛的应用。构造分类器的方法很多,常见的有贝叶斯网络、决策树、基于实例的学习、人工神经网络、支持向量机等。虽然朴素贝叶斯分类器基于“在给定类标记时属性值之间相互条件独立”的假设不现实,但是有监督学习表明:其分类性能仍然可与决策树算法、k-...
内容介绍
此文档由会员 那年三月 发布
文本分类系统的设计与实现
摘要 分类是数据挖掘中一项非常重要的任务,在现实生活中有着广泛的应用。构造分类器的方法很多,常见的有贝叶斯网络、决策树、基于实例的学习、人工神经网络、支持向量机等。虽然朴素贝叶斯分类器基于“在给定类标记时属性值之间相互条件独立”的假设不现实,但是有监督学习表明:其分类性能仍然可与决策树算法、k-近邻算法等经典算法相当。
虽然单分类器的性能不差,但在日益需求更高的性能的今天,单分类器已经不能够满足更高的需求。因此集成学习已经成为了机器学习和数据挖掘领域中的热门研究方向。
本文介绍和分析了文本分类中常用的分类算法,然后描述了一个基于朴素贝叶斯分类的集成学习方法的向量文本分类系统的基本组成,并给出了一个系统的基本构架。在此基础上设计并实现了一个基于朴素贝叶斯分类的集成学习的向量文本分类系统。