首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种基于类别的组合型文本特征选择
引用本文:刘海峰,赵华,刘守生.一种基于类别的组合型文本特征选择[J].情报学报,2010,29(4).
作者姓名:刘海峰  赵华  刘守生
作者单位:解放军理工大学理学院,南京,210007
基金项目:国家自然科学基金资助项目 
摘    要:文本特征降维对文本分类的精确性有着非常重要的影响.本文针对传统的TF-IDF没有考虑特征项的类间分布状况以及对类属低频词的抑制现象、MI在训练样本类别分布偏斜条件下的不足问题分别进行了改进,进而提出了一种基于类别的组合型文本特征选择算法.随后的文本分类试验表明,本文提出的加权模型相比较于传统的TF-IDF以及MI方法可以有效提高文本分类的精度.

关 键 词:文本分类  特征选择  互信息方法  特征加权

A combined text feature selection algorithm based on category information
Liu Haifeng,Zhao Hua,Liu Shousheng.A combined text feature selection algorithm based on category information[J].Journal of the China Society for Scientific andTechnical Information,2010,29(4).
Authors:Liu Haifeng  Zhao Hua  Liu Shousheng
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号