首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于特征缺失补偿最大熵模型的文本分类
引用本文:祁瑞华,杨德礼,胡润波.基于特征缺失补偿最大熵模型的文本分类[J].情报杂志,2010,29(5).
作者姓名:祁瑞华  杨德礼  胡润波
作者单位:1. 大连外国语学院现代教育技术中心,大连,116044;大连理工大学管理学院系统工程研究所,大连,116024
2. 大连理工大学管理学院系统工程研究所,大连,116024
基金项目:国家自然科学基金,国家自然科学基金重大项目 
摘    要:针对自然语言处理中普遍存在的特征缺失问题,提出了基于特征缺失补偿最大熵模型的文本分类方法.为避免数据稀疏时出现训练过适应,采用高斯先验平滑进行特征补偿,并提出基于条件最大熵计算增益和基于特征频数的混合特征选择方法.通过实验将本方法与中心法、最近邻、贝叶斯、SVM和平滑前的最大熵文本分类器进行了比较,实验结果表明基于特征缺失补偿最大熵模型分类器的综合性能超过以上算法.

关 键 词:特征缺失  最大熵  文本分类  特征选择

Text Classification Algorithm Based on Maximum Entropy and Compensation Strategy for Unseen Features
Qi Ruihua et al.Text Classification Algorithm Based on Maximum Entropy and Compensation Strategy for Unseen Features[J].Journal of Information,2010,29(5).
Authors:Qi Ruihua
Institution:Qi Ruihua et al
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号