首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对经典K-means聚类算法过于依赖初始聚类中心和易陷入局部最优的不足,提出一种带有学习能力的人工蜂群算法(ABC)与K-means迭代相结合的聚类算法。该算法通过能动态调节的学习权重因子来平衡人工蜂群算法的全局探测与局部搜索能力,同时结合K-means聚类快速的优点,来提高聚类算法的全局寻优能力,降低初始聚类中心对算法聚类质量的影响。通过仿真试验验证,该算法克服了K-means算法的缺点,具有收敛速度快、稳定性强和聚类精度高的优势,得到良好的聚类效果。  相似文献   

2.
以标准K-means算法在旅游客户细分的应用中存在的聚类效果不佳等缺陷为着眼点,本文设计了一种以初始化中心优化K-means算法为基础的旅游客户细分模型,首先优化该算法中相似度的计算中的距离度量,之后再以K-means算法聚类效果对初始质心严重依赖和对数据输入顺序敏感等缺点为着眼点,提出寻找较为准确的K个聚类中心的方法。结果表明,通过改进K-means算法得到的客户划分,类别明确,类别之间的界限清晰,说明通过对客户的划分定义明确,划分效果较好。  相似文献   

3.
针对K-means聚类算法中的k值确定给聚类算法效果带来不确定性的问题,本文通过引入多层变量加权概念,提高聚类效果的收敛性,引入改进的非加权组平均法和最大最小距离算法有效的解决k值确定问题,引入Max-Entropy算法解决分布簇内节点分布不均导致的计算问题。仿真实验中,将本文算法的改进的效果进行研究,并结合云计算环境下通过使用本文算法在挖掘的加速比,花费时间上都取得了比较好的效果。  相似文献   

4.
密度峰值聚类(Density peaks clustering简称DPC)算法是2014年在美国Science期刊上发表的一种非常简洁优美的聚类算法,它不需要像经典K-means算法那样迭代,也不需要很多参数。DPC算法的核心思想在于对聚类中心的刻画,它通过计算数据集中每个数据点的局部密度和该点到具有更高局部密度的点的最小距离,当数据点的■的值较大时,该点为聚类中心。然而通过分析,发现这样选取聚类中心得聚类效果不具有稳健性,依赖于和的量纲。本文提出一种改进的密度峰值聚类算法,将和归一化后的和记为每个点的权重,构造函数■作为选取聚类中心的判决函数,结合模拟计算,验证本文的方法更鲁棒,选取聚类中心效果更好,且复杂度降低。  相似文献   

5.
针对标准K-means算法在对教学数据分析时还存在效果不好等问题,本文提出一种基于种群优化遗传算法优化K-means聚类的高校艺术教学数据分析模型,首先为了保证遗传算法的种群多样性,然后利用小生境方法限制种群个体的繁衍,以达到种族多样化的优化,接着定义了染色体的惩罚函数,根据染色体对数据的聚类结果来动态调节染色体的适合度,防止染色体早熟现象的出现,最后构建高校艺术教学数据分析模型。仿真试验结果表明,基于种群优化遗传算法优化K-means聚类的高校艺术教学数据分析模型相比较标准K-means算法具有更好的分析效果。  相似文献   

6.
在云计算环境下,针对K-means对初始聚类中心敏感和易陷入局部最优的缺点,进行K-means聚类中心优化求解,提高对海量数据的聚类处理能力。传统方法采用动态干扰信任感推荐方法进行数据聚类中心求解,聚类中心对初始值敏感性较强,数据聚类效果不好。提出一种基于粒子群密度最大距离凹函数构建和边界隶属度特征分析的云计算中K-means聚类中心优化求解方法。通过云计算处理,对数据聚类余下样本点按照与聚类中心的相似程度来划分成k类,对原始变量数据的差异化特征进行降维处理,通过搜索空间中的粒子,每一个粒子自身都有速度、位置和适应度,通过迭代找到最优解,进行数据规范化预处理,数据预处理包括选择数量,类型和特征的标度,进行边界隶属度特征分析,实现云计算数据的聚类改进。仿真结果表面,该算法对云计算数据的聚类性能优越,聚类中心求解准确,克服了传统的K-means对初始聚类中心敏感和易陷入局部最优的缺点,应用价值较大。  相似文献   

7.
一种改进的K-means算法   总被引:1,自引:0,他引:1  
K-means算法是聚类算法中最经典的划分算法之一,它对初值的依赖性很强,聚类结果随初始聚类中心选择的不同而波动很大。提出了一种改进的K-means算法,运用Kruskal算法生成聚类对象的最小生成树(MST),按权值从大到小删去K-1条边,得到的K个连通子图中对象的均值作为初始聚类中心进行聚类。由仿真实验表明,K-means算法较传统算法有更好的聚类效果和准确性。  相似文献   

8.
郭文娟 《科技风》2022,(4):63-65
针对传统的K-means算法运行的结果依赖于初始的聚类数目和聚类中心,本文提出了一种基于优化初始聚类中心的K-means算法.该算法通过量化样本间距离和聚类的紧密性来确定聚类数目K值;根据数据集的分布特征来选取相距较远的数据作为初始聚类中心,避免了传统K-means算法的聚类数目和聚类中心的随机选取.UCI机器学习数据...  相似文献   

9.
本文将数据挖掘算法应用干智能答疑系统中,提出了一套基于数据挖掘算法的答疑设计方案并加以改进,传统的K-均值算法聚类虽然速度快,在文本聚类中易于实现,但其同样依赖于所有变量,聚类效果往往不尽如人意.为了克服这一缺点,提出一种改进的K-均值文本聚类算法.它在K-均值聚类过程中,向每一个聚类簇中的关键词自动计算添加一个权重,重要的关键词赋予较大的权重.经过实验测试.获得了一种基于子空闻变量自动加权的适合文本数据聚类分析的改进算法,它不仅可以在大规模、高维和稀疏的文本数据上有效地进行聚类.还能够生成质量较高的聚类结果.实验结果表明基于子空闻变量自动加权的K-均值文本聚类算法是有效的大规模文本数据聚类算法.  相似文献   

10.
基于优化初始类中心点的K-means改进算法   总被引:2,自引:0,他引:2  
K-means算法是一种重要的聚类算法,在网络信息处理领域有着广泛的应用。由于K-means算法终止于一个局部最优状态,所以初始类中心点的选择会在很大程度上影响其聚类效果。本文提出了一种K-means算法的改进算法,首先探测数据集中的相对密集区域,再利用这些密集区域生成初始类中心点。该方法能够很好地排除类边缘点和噪声点的影响,并且能够适应数据集中各个实际类别密度分布不平衡的情况,最终获得较好的聚类效果。  相似文献   

11.
《软科学》2019,(6):135-139
综合考虑贫困人口分级单指标和多指标,提出了一种基于数据场K-means融合聚类的农村贫困人口精准分级方法,该方法先由数据场势函数得到初始聚类的个数与聚类中心,再将其导入K-means聚类算法得到最终分级结果,有效地解决了传统K-means算法需要主观给定聚类参数的问题。最后,以贵州省某乡镇贫困人口数据为例进行实证分析,结果表明,该融合聚类方法更简洁、高效,能够为农村贫困人口分级提供科学合理的参考。  相似文献   

12.
基于改进特征提取及聚类的网络评论挖掘研究   总被引:1,自引:0,他引:1  
[目的/意义]针对信息过载条件下中文网络产品评论中特征提取性能低以及特征聚类中初始中心点的选取问题。[方法/过程]本研究提出采用基于权重的改进Apriori算法产生候选产品特征集合,再根据独立支持度、频繁项名词非特征规则及基于网络搜索引擎的PMI算法对候选产品特征集合进行过滤。并以基于HowNet的语义相似度和特征观点共现作为衡量产品特征之间关联程度的特征,提出一种改进K-means聚类算法对产品特征进行聚类。[结果/结论]实验结果表明,在特征提取阶段,查准率为69%,查全率为92.64%,综合值达到79.07%。在特征聚类阶段,本文提出的改进K-means算法相对传统算法具有更优的挖掘性能。  相似文献   

13.
提出基于非线性Kdv-KSV方程平衡泛函的优化聚类算法,运用非线性kdv-ksv方程式定义映射集范数设置初始类聚中心,通过泛函空间完成聚类数据的中心向量数域计算,划分聚类数据目标函数,利用隶属矩阵判断划分得到最优聚类的过程。仿真实验表明,基于非线性Kdv-KSV方程平衡泛函的优化聚类算法,数据收敛速度更快,动态特性跟踪效果更好,并且降低了聚类计算对初始值的依赖性。提高了处理高维数据的能力。  相似文献   

14.
聚类算法通常用于数据的聚类。除此,它还可以用于异常数据的检测。首先介绍了基于划分的聚类算法K-means,然后给出改进算法I-K-means的算法描述,最后通过实例进行异常分析。  相似文献   

15.
室内定位算法精度一直都是研究的重点,本文提出了一种基于粒子群算法,减聚类算法和Kmeans算法进行结合。本文首先构建室内定位RFID模型,构建定位方程,然后采用减聚类算法来避免人为干扰,通过K-means算法来形成初始化粒子群算法,最后采用粒子群算法训练RBF神经网络的所有参数,从而得到优化的输出模型,从而确定了定位最优点。仿真实验表明本文的算法可以有效的提高定位精度,降低能量消耗,提高定位精度10%。  相似文献   

16.
一种基于聚类的云计算任务调度算法   总被引:1,自引:0,他引:1  
任务调度是云计算中的一个关键问题.针对 Min-Min 算法负载不平衡的缺点,引入 K-means 聚类,提出一种基于 K-means 聚类和 Min-Min 的云计算任务调度的新算法.该算法采用 K-means 聚类方法依据任务长度对任务聚类进行预处理,然后根据 Min-Min 算法的机制进行任务调度.仿真结果表明,该算法具有较好的负载均衡性和系统性能.  相似文献   

17.
由于学生的不同,他们对高等数学的接受能力也不同,因此统一的教学无法在众多的学生中适用。对此,本文设计了一种以初始化去噪和质心优化K-means聚类算法为基础的高等数学教学分层模型,这一模型首先将噪处理标准K-means聚类算法的初始化数据,之后再改进算法的初始化数据,这一过程主要是借助优化聚类中心的方法进行。最后再在高等数学教学分层中应用这一改进后的算法。仿真实验结果证明,本文提出的以质心优化K-means聚类算法以及数据初始化去噪为基础的教学分层模型具有较好的收敛性,并且可以较好地在高等数学教学中实现分层。  相似文献   

18.
k-means算法在运行过程中对聚类中心有着很高的要求,本文通过萤火虫算法初始化k-means算法的聚类中心,从而确保k-means算法得到更好的聚类效果。  相似文献   

19.
本文对K-means和CURE聚类算法的算法思想和优缺点进行了深入的理论研究,并对这两类算法的性能进行了分析与比较。  相似文献   

20.
随着数据库技术的不断发展,现有的聚类分析算法已经无法满足数据挖掘的聚类分析的需求。本文主要针对传统的模糊C聚类算法,将其中存在的问题进行改进,并在核函数和权值优化的基础上,提出模糊C聚类算法。首先对模糊C聚类算法的特征权值进行优化,然后引入核函数的概念,对模糊C聚类算法的寻优过程进行改进。仿真验证得到的结果是,本文所提出的模糊C聚类算法,能够在核函数和权值优化上有更好和更加稳定的聚类。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号