首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于新型文档频的平均互信息改进研究
引用本文:姜祖新,张德贤,张苗,李军军.基于新型文档频的平均互信息改进研究[J].教育技术导刊,2012,11(5):138-139.
作者姓名:姜祖新  张德贤  张苗  李军军
作者单位:河南工业大学信息科学与工程学院;
摘    要:互信息未考虑单个特征词发生的频率,不仅造成了互信息评价函数倾向于选择特征的稀有词,而且还过滤掉了经常出现的高频词。当特征关键词和类别都增多时,得到的特征关键词与类别之间的平均互信息变小,说明数据在处理过程中去掉了信息,不会创造出新的信息。为此把文档频引进平均互信息,使其对平均互信息的缺点进行修正。实验证明,该方法具有训练和测试速度快,特征提取速度非常快等特点。

关 键 词:平均互信息  文档频  评价函数  
点击此处可从《教育技术导刊》浏览原始摘要信息
点击此处可从《教育技术导刊》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号