首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种k-NN文本分类器的改进方法
引用本文:巩军,刘鲁.一种k-NN文本分类器的改进方法[J].情报学报,2007,26(1):56-59.
作者姓名:巩军  刘鲁
作者单位:北京航空航天大学经济管理学院,北京,100083
摘    要:自动文本分类是提高信息利用效率和质量的有效方法。训练文本分布的不均匀会对分类的效果产生负面影响,而在实际中,很难使训练文本的分布达到均匀。针对这一问题,提出了一种改进的k-NN文本分类方法。通过在英文和中文两个文本集的实验表明,改进后的方法不仅分类的准确性有了提高,而且表现出较好的稳定性。

关 键 词:文本分类  信息检索  算法
修稿时间:2006年1月11日

An Improved k-Nearest Neighbor Method in Automatic Text Categorization
Gong Jun,Liu Lu.An Improved k-Nearest Neighbor Method in Automatic Text Categorization[J].Journal of the China Society for Scientific andTechnical Information,2007,26(1):56-59.
Authors:Gong Jun  Liu Lu
Abstract:Automatic text categorization is an effective method to increase efficiency and quality of information utilization. The uneven distribution in training set will affect categorization result negatively,while it is uneasy to get even distribution in training set in reality.To this problem,we present an optimized k-NN method and verified its effectiveness by the experiments on both English and Chinese text sets.The classification performance is promoted by the improvement of precision and stability.
Keywords:k-NN
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号