首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于中文学术期刊人工标引的自动分类新算法
引用本文:王洪,贾惠波,徐端颐.基于中文学术期刊人工标引的自动分类新算法[J].现代图书情报技术,2002(Z1).
作者姓名:王洪  贾惠波  徐端颐
作者单位:[1]清华大学光盘国家工程研究中心 [2]清华大学光盘国家工程研究中心 北京 [3]北京
基金项目:国家重点基础研究973项目(G19990330)
摘    要:为了解决中文学术期刊电子化过程中出现的自动分类问题,提出了一种基于中文学术期刊人工标引的自动分类算法。这种算法主要利用自动分词得到各文献的特征词向量空间,并考虑到人工标引在分类中的关键作用,得到综合了特征词IF和IDF权重的分类准则。通过适当训练建立分类库,计算待分类样本与已知分类的相似性,判别各分类。实验表明,该分类算法可以获得85%以上的分类识别率。

关 键 词:自动分类  人工标引  特征词向量空间  【分类号】  TP391
本文献已被 CNKI 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号