k近邻文本分类器的设计与实现.doc
约32页DOC格式手机打开展开
k近邻文本分类器的设计与实现,摘要 时代的进步,信息产品的多样化,世界范围内的因特网的飞速发展,使得网络技术已经渗透到了我们生活的各个角落。现在因特网已经发展成为了世界上最大、信息最齐全的多媒体信息库。我们怎样才能从因特网上准确快速地找到我们想要的信息是目前所面临的难题。在这样一个大环境下,文本分类器应运而生,它的出现,...
内容介绍
此文档由会员 那年三月 发布
k近邻文本分类器的设计与实现
摘要 时代的进步,信息产品的多样化,世界范围内的因特网的飞速发展,使得网络技术已经渗透到了我们生活的各个角落。现在因特网已经发展成为了世界上最大、信息最齐全的多媒体信息库。我们怎样才能从因特网上准确快速地找到我们想要的信息是目前所面临的难题。在这样一个大环境下,文本分类器应运而生,它的出现,使这一问题得到很好的解决。
K近邻算法是一种简单,但是非常有效的文本分类算法,有着广泛的应用。本文针对K近邻算法进行研究,该算法的基本思路是,先将训练文本集中所有文本表示成向量的形式,再将这文本向量组成文本向量集并储存起来,当待分类文本到达时,计算这篇文本与训练文本集中每一个文本的相似度,并将计算得到的值按降序排列,找出排在最前面的K篇文本,然后根据这K篇文本所属的类别来判断待分类文本所属的类别。