基于新型文档频的平均互信息改进研究 |
| |
引用本文: | 姜祖新,张德贤,张苗,李军军.基于新型文档频的平均互信息改进研究[J].教育技术导刊,2012,11(5):138-139. |
| |
作者姓名: | 姜祖新 张德贤 张苗 李军军 |
| |
作者单位: | 河南工业大学信息科学与工程学院; |
| |
摘 要: | 互信息未考虑单个特征词发生的频率,不仅造成了互信息评价函数倾向于选择特征的稀有词,而且还过滤掉了经常出现的高频词。当特征关键词和类别都增多时,得到的特征关键词与类别之间的平均互信息变小,说明数据在处理过程中去掉了信息,不会创造出新的信息。为此把文档频引进平均互信息,使其对平均互信息的缺点进行修正。实验证明,该方法具有训练和测试速度快,特征提取速度非常快等特点。
|
关 键 词: | 平均互信息 文档频 评价函数 |
|
| 点击此处可从《教育技术导刊》浏览原始摘要信息 |
| 点击此处可从《教育技术导刊》下载免费的PDF全文 |
|