首页 | 本学科首页   官方微博 | 高级检索  
     检索      

K-means算法最佳聚类数评价指标研究
引用本文:郭靖,侯苏.K-means算法最佳聚类数评价指标研究[J].教育技术导刊,2017,16(11):5-8.
作者姓名:郭靖  侯苏
作者单位:中国人民公安大学 信息技术与网络安全学院,北京 100038
摘    要:聚类分析广泛应用于商务智能、图像模式识别、Web搜索、生物学等领域,是一种无指导的观察式学习。然而,绝大多数聚类分析算法都面临着一个非常棘手的问题——最佳聚类数的确定。K-means是典型的基于划分的聚类方法,它需要用户输入聚类数K,但这通常非常困难。聚类数的确定是决定聚类质量的关键因素。虽然有许多被用来估计最优聚类数的聚类评价指标,但对于不同的聚类算法,不同的评价指标效果差异很大。为确定针对K-means聚类算法效果最好的评价指标,采用4种典型的不同聚类结构特征的人工模拟数据以及来自UCI的真实数据集对7种评价指标的性能进行实验比较,结果表明CH指标和I指标在评估K-means算法的最佳聚类数时效果较好。

关 键 词:聚类指标  K-means算法  聚类分析  聚类数  
点击此处可从《教育技术导刊》浏览原始摘要信息
点击此处可从《教育技术导刊》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号