首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对传统 K-means 算法随机选取初始聚类中心导致聚类结果随机性大、优劣不定的缺点,通过定义局部方差,利用方差反映数据密集程度的特性,提出一种基于最小 局部方差优化初始聚类中心的 K-means 算 法。该算法选取数据集中局部方差最小的点作为一个初始聚类中心,并利用数据信息更新数据集,直到选到 k个初始聚类中心,实现初始聚类中心优化。基于 UCI 数据集与人工数据集进行实验,与传统 K-means 算法及最小方差优化初始聚类中心的 K-means 算法进行性能比较。实验结果表明,基于最小局部方差优化初始聚类中心的 K-means算法具有良好的聚类效果和很好的鲁棒性,且聚类时间较短,验证了算法有效性和优越性。  相似文献   

2.
传统的K—means算法对初始聚类中心敏感,聚类的结果随不同的初始输入而波动.为了消除这种敏感性,提出了一种改进的K-means算法,改善聚类算法中选取初值的依赖性,提高聚类结果的稳定性.仿真实验结果表明:改进后的K-means算法优于原始算法.  相似文献   

3.
提出了一种基于改进蚁群算法的动态K-均值聚类算法思想,该算法首先利用蚁群算法的较强处理局部极值的能力,动态地确定了聚类数目和中心,然后利用蚁群聚类得到的结果,再进行K-均值聚类弥补蚁群算法的不足。两者有机结合起来可以寻求到具有全局分布特性的最优聚类,实现了基于改进的蚁群聚类算法分析。  相似文献   

4.
提出了一种基于改进蚁群算法的动态K-均值聚类算法思想。该算法首先利用蚁群算法较强处理局部极值的能力,动态地确定了聚类数目和中心,然后利用蚁群聚类得到的结果,进行K-均值聚类弥补蚁群算法的不足。两者的有机结合可以寻求到具有全局分布特性的最优聚类,实现基于改进的蚁群聚类算法分析。  相似文献   

5.
为改善网络舆情态势感知与预警中舆情信息分析不准确的问题,提出基于 Spark 技术的均值漂移(MS)算法,利用该算法原理分析 Spark 框架特性,给出该算法在 Spark 框架中的实现过程,包括舆情信息预处理、特征提取、特征向量模型构建和算法聚类设计。在相同数据集下将 MS 算法和 K-means 算法聚类效果进行对比,实验结果显示,K-means 算法聚类结果受 k 值选取的影响,存在聚类结果不准确的问题;基于 Spark 的 MeanShift 算法在没有任何先验条件下舆情聚类效果优于 K-means 聚类算法,且符合预期期望。  相似文献   

6.
为促进垃圾分类政策实施,科学、合理地在居民生活小区设置垃圾分类站,建立选址模型和成本模型对垃圾分类站建设运营成本及居民满意度负效应成本进行求解,并对K-means聚类算法与模糊C-means聚类算法进行比较。通过对某小区每栋居民楼到垃圾分类站的平均距离分析得出,K-means聚类算法计算得出的平均距离相比模糊C-means聚类算法缩短了约17%,在成本模型中建设运营成本降低了1万元,居民满意度负效应成本降低了0.68万元,验证了模型的可行性及K-means聚类算法的优越性。在未来的研究中可对算法进行改进,以进一步优化成本,确定全局最优。  相似文献   

7.
为了提高粒子群算法的收敛速度和全局收敛性,本文在标准粒子群算法的基础上作了改进,提出了一种带模拟退火步长的粒子群算法.通过典型函数的测试结果表明新算法比原来算法收敛到最优解的次数多,提出的新算法在全局搜索能力和收敛速度方面有所提高.  相似文献   

8.
K-means聚类算法研究   总被引:2,自引:0,他引:2  
聚类分析是模式识别中一个重要研究领域,是一种将数据划分或分组处理的重要手段和方法.K-means算法是聚类算法中主要算法之一,文章介绍了K-means聚类算法的实现方法,并对其优点和缺点进行了详细的分析.  相似文献   

9.
分析了K均值聚类算法(K-means)存在的不足和改进遗传算法的全局优化能力,提出一种基于改进遗传算法的文本聚类方法,该方法将原始文档转化成用向量空间模型来描述的文本向量,首先随机产生若干个文档向量作为初始聚类中心形成遗传算法的染色体种群,经过改进遗传算法的选择、交叉、变异进化运算,得到较为优化的K均值聚类算法的初始聚类中心。实验表明该算法文本聚类提高了查准率和查全率,算法的高效性也得到了验证。  相似文献   

10.
为了解决K-means算法中对于初值的敏感,提出了一种基于粒子群的改进的K-means聚类算法(IPSOFCM).在K-means算法中引入粒子群算法,可有效提高算法的全局搜索能力,有助于粒子更容易跳出局部束缚.实验结果证明,IPSOFCM算法聚类准确度高,稳定性好.  相似文献   

11.
提出一种基于贪心随机自适应搜索过程的聚类算法.该算法先根据密度概念构造一个约束候选列表,然后从列表中随机选取k个对象作为K均值算法的k个起始中心点.试验结果表明该算法的聚类结果比k均值算法有显著改进.  相似文献   

12.
传统欠采样方法在处理不平衡数据问题时只考虑多数类样本的绝对位置而忽略了其相对位置,从而使产生的平衡数据集存在边界模糊问题。提出一种改进 K 均值聚类的不平衡数据欠采样算法(UD-PK)。该算法首先利用改进的 PSO 算法迭代寻找全局最优解作为 K-means 聚类所需初始值,然后通过 K-means 进行聚类,再按照每个类别中多数类与少数类的比例定义所取多数类样本个数,并根据多数类样本与簇心距离择优选择参与平衡数据集构造。在 UCI 数据集上的对比试验表明,该算法在少数类准确率上较一些经典算法有很大提升。  相似文献   

13.
k均值算法是一个常用的局部搜索算法,它的主要缺陷是容易陷入局部极小,并且该局部极小解与全局最优解往往有很大的偏差。本文提出一个基于K-均值的迭代局部搜索文档聚类算法。该算法以k均值算法所得到的解作为初始解,从该初始解开始作局部搜索。在搜索过程中接受部分劣解。当解无法改进时,算法对所得到的局部极小解做适当强度的扰动后进行下一次的迭代,以跳出局部极小,从而拓展了搜索的范围。实验结果表明该算法对文档数据集聚类的正确性迭99%以上。  相似文献   

14.
根据旅行商问题中城市分布的特点,提出了分区域聚类的蚁群算法.首先,对城市分布进行球形聚类,再分别对剩下的城市进行线形聚类和孤立点聚类.采用这样的分区域聚类的蚁群算法收敛速度快,寻求的解更优.实验表明,该算法比基本蚁群算法在求得解更优的同时,速度快3~13倍.  相似文献   

15.
针对谱聚类算法稳定性较差的问题,提出了一种改进的半监督谱聚类算法。该算法依据图像的颜色、纹理和空间特征进行聚类,通过Bayes距离学习对相似度矩阵的内容进行修正;然后,使用半监督K—means聚类算法对调整后的特征向量进行聚类划分。仿真实验结果表明。较传统谱聚类而言该算法在准确率及稳定性上都有了显著提升。  相似文献   

16.
目标植株图像压缩重构对于图像的高效传输及存储意义重大,同时为后期植株生长状态检测及病虫害识别奠定了基础。传统图像压缩感知方法大多是针对信号在某个特征空间的稀疏性进行的,并没有考虑信号的局部特征与结构化特性,存在重构效率不高、重构精度较低等问题。针对以上情况,提出一种基于非凸低秩优化的压缩感知植株图像重构算法。首先通过KinectV2.0采集植株图像深度数据并进行预处理,结合K-means与Mean-shift聚类算法提取目标植株有效区域,再考虑图像的非局部自相似性,采用加权[lp]范数最小化算法(WSNM)求解低秩优化问题,较好地保留了图像结构细节,最后采用Dog-leg最小二乘算法取代最快下降法进行迭代优化。试验结果证明,该算法在不同采样率下的植株图像重构质量优于其它同类算法,尤其在低采样率下重构效果更为突出。  相似文献   

17.
政府公文数量巨大,不同政府网站公文分类规则不一 ,在引用和参考公文时可能发生混淆 。针对该问题,基于政府公文题目、摘要和正文内容,采用 K-means 算法对公文进行分类。首先对政府公文进行分词及去停用词等数据预处理操作,再通过词频—逆文档频率(TF-IDF)权值计算方法,将处理后的政府文本信息转换成二维矩阵,然后采用 K-means 算法进行聚类。使用清华大学 THUCTC 文本分类系统对公文聚类结果进行测试。实验结果表明,采用 K-means 算法对公文进行聚类,准确率达到 82.93%,远高于政府网站公文分类准确率。  相似文献   

18.
一种K-means算法的k值优化方案   总被引:1,自引:0,他引:1  
聚类算法是数据挖掘中核心技术之一,而k-means算法在经典聚类算法中占有重要地位。针对k-means聚类算法的最佳聚类个数k不易获得,因而使得该聚类算法的应用受到限制,为此提出一种k值优化方法:通过给出大于最佳聚类数的可能聚类数,而得到优化的聚类个数。通过实例给予验证,其结果说明该方法合理有效。  相似文献   

19.
互联网时代,网络焦点话题讨论对当代高校学生的思想有很大影响,因此对高校舆情进行监测具有十分重要的意义。通过改进的K-means算法对高校舆情进行聚类,获取舆情热点。通过聚类算法获取热点话题,进而对热点舆情话题进行引导,对改进高校学生思想政治工作作用显著。对改进算法进行实验,结果表明该算法准确率达到75%,比传统算法高出8%,改善了传统算法的聚类效果。  相似文献   

20.
基于向量空间模型的文档聚类算法研究   总被引:3,自引:0,他引:3  
随着网络信息的迅速增长,文档聚类技术成为了人们研究的热点课题.探讨了几种基于向量空间模型的文档聚类算法,如常见的k—means算法和凝聚层次算法,针对它们的不足提出了改进的BK-means算法和多层CFK-means算法.最后,根据一定的评价标准,得出Bk—means算法是文档聚类算法中较好的算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号