基于中文学术期刊人工标引的自动分类新算法 |
| |
引用本文: | 王洪,贾惠波,徐端颐.基于中文学术期刊人工标引的自动分类新算法[J].现代图书情报技术,2002(Z1). |
| |
作者姓名: | 王洪 贾惠波 徐端颐 |
| |
作者单位: | [1]清华大学光盘国家工程研究中心 [2]清华大学光盘国家工程研究中心 北京 [3]北京 |
| |
基金项目: | 国家重点基础研究973项目(G19990330) |
| |
摘 要: | 为了解决中文学术期刊电子化过程中出现的自动分类问题,提出了一种基于中文学术期刊人工标引的自动分类算法。这种算法主要利用自动分词得到各文献的特征词向量空间,并考虑到人工标引在分类中的关键作用,得到综合了特征词IF和IDF权重的分类准则。通过适当训练建立分类库,计算待分类样本与已知分类的相似性,判别各分类。实验表明,该分类算法可以获得85%以上的分类识别率。
|
关 键 词: | 自动分类 人工标引 特征词向量空间 【分类号】 TP391 |
本文献已被 CNKI 维普 等数据库收录! |
|