数字图书馆中基于向量空间模型的文档分类系统 |
| |
引用本文: | 成奋华,吴家强.数字图书馆中基于向量空间模型的文档分类系统[J].情报杂志,2004,23(7):9-11. |
| |
作者姓名: | 成奋华 吴家强 |
| |
作者单位: | 长沙民政学院电子信息工程系,长沙,410004 |
| |
摘 要: | 介绍了一个建立在向量空间模型上的文档分类系统。该系统着重解决向量维数压缩和中文专有词汇获取等问题。在特征项的选取上,并不采用文档中出现的全部词汇,而是利用语料库统计信息生成的关键词汇。实验结果表明,较之以采用全体词汇作为特征项进行分类的方法,本方法能有效地进行向量维数压缩,同时也提高了分类准确率。
|
关 键 词: | 数字图书馆 向量空间模型 文档分类系统 词汇压缩 关键词 信息检索 |
Research of Document Classification System Based on Vector Space Model in Digital Library |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
|