首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种改进的贝叶斯文本分类模型
引用本文:王潇,胡鑫.一种改进的贝叶斯文本分类模型[J].邢台职业技术学院学报,2006,23(1):19-21.
作者姓名:王潇  胡鑫
作者单位:西北师范大学,数学与信息科学学院,甘肃,兰州,730070
摘    要:朴素贝叶斯文本分类模型是一种简单而高效的文本分类模型,但是它的独立性假设属性使其无法表示现实世界属性之间的依赖关系,从而影响它的分类性能。这里提出一种改进的基于贝叶斯定理的文本分类模型——“树桩网络(Stump Network)”,并将该方法与朴素贝叶斯文本分类器和TAN(Tree Augmented Naive Bayes)文本分类器进行实验比较,结果表明,在大多数数据集上该文本分类方法具有较高的分类正确率。

关 键 词:文本分类  树桩网络  朴素贝叶斯  TAN
文章编号:1008-6129(2006)01-0019-03
收稿时间:2005-11-22
修稿时间:2005年11月22

The Improvement of Naive Bayes Text Classifier
WANG Xiao,HU Xin.The Improvement of Naive Bayes Text Classifier[J].Xingtai Vocational and Technical College,2006,23(1):19-21.
Authors:WANG Xiao  HU Xin
Abstract:Na?ve Bayes text classifier is a simple and effective text classification method,but its attribute independence assumption makes it unable to express the dependence among attribute in the real world,and affects its classification performance.In this paper,an improved text classification model based on Bayes theorem called Stump Network is presented.Stump Network text classifier is compared with Na?ve Bayes text classifier and TAN(tree augmented naive Bayes) by an experiment.Experimental results show this model has higher classification accuracy in most data sets.
Keywords:text categorization  stump network  na?ve bayes  TAN
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号