首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于向量空间模型的文档聚类算法研究
引用本文:何飞,蒋冬初.基于向量空间模型的文档聚类算法研究[J].湖南城市学院学报,2003,24(3):114-116.
作者姓名:何飞  蒋冬初
作者单位:1. 中南大学,信息科学与工程学院,湖南,长沙,410083
2. 湖南城市学院,物理与电子工程系,湖南,益阳,413049
摘    要:随着网络信息的迅速增长,文档聚类技术成为了人们研究的热点课题.探讨了几种基于向量空间模型的文档聚类算法,如常见的k—means算法和凝聚层次算法,针对它们的不足提出了改进的BK-means算法和多层CFK-means算法.最后,根据一定的评价标准,得出Bk—means算法是文档聚类算法中较好的算法.

关 键 词:向量空间模型  文档聚类算法  k-means算法  凝聚层次算法  BK-means算法  多层CFK-means算法  文本挖掘  信息检索
文章编号:1672-1942(2003)03-0114-03
修稿时间:2003年2月27日

A Research of Document Clustering Algorithm Based on Vector Space Model
HE Fei,JIANG Dong-chu.A Research of Document Clustering Algorithm Based on Vector Space Model[J].Journal of Hunan City Univeristy,2003,24(3):114-116.
Authors:HE Fei  JIANG Dong-chu
Institution:HE Fei1,JIANG Dong-chu2
Abstract:With the rapid development of network information, document clustering technique has become focused problem to be inverstigated. Several document clustering algorithms based on vector space model are discussed in this paper, e.g., K-means algorithm and agglomerative hierarchical clustering algorithm. Because of their inefficiency, two ways of improving. BK-means algorithm and CFK-means algorithm are set forth. Finally BK-means algorithm is regarded as a better way of algorithm in document clustering algorithms according to certain standard of evaluation.
Keywords:vector space model  document clustering algorithm  k-means algorithm  similarity
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号