基于改进VSM的Web文本分类方法 |
| |
引用本文: | 胡晓,王理,潘守慧.基于改进VSM的Web文本分类方法[J].情报杂志,2010,29(5). |
| |
作者姓名: | 胡晓 王理 潘守慧 |
| |
作者单位: | 北京航空航天大学图书馆,北京,100191 |
| |
摘 要: | Web文本自动分类技术是Web文本挖掘的关键技术之一.针对Web文档中不同标签中的文本具有不同的表达文档内容的能力,提出了改进的特征项加权计算方法.根据特征项在文档中的位置和出现频率计算其权值,并给出了具体的Web文本分类算法和评测方法.经实验验证,改进后系统的微平均查准率均大于0.8,分类性能明显好于改进前.
|
关 键 词: | Web文本分类 向量空间模型 文本挖掘 |
Web Text Classification Approach Based on Improved VSM |
| |
Abstract: | |
| |
Keywords: | VSM |
本文献已被 CNKI 万方数据 等数据库收录! |
|