首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 18 毫秒
1.
优化特征加权的FCM算法   总被引:1,自引:0,他引:1  
模糊聚类是一种重要数据分析和建模的无监督方法.在FCM算法中,考虑到样本矢量中各维特征对模式分类的不同影响,本文提出一种优化特征加权的模糊聚类算法,该算法利用主成分分析法提取主要特征向量并根据其对方差的贡献率不同赋予相应权重进行聚类分析.  相似文献   

2.
模糊c均值(FCM)聚类算法广泛用于图像的自动分割,但是该算法没有考虑像素的灰度和空间特征,对噪声十分敏感。提出了一种基于直方图的加权模糊c均值(WFCM)聚类的图像分割方法,在传统的FCM聚类的基础上,该方法考虑了灰度直方图的灰度、邻域像素灰度的相关性对图像进行加权聚类分割。实验结果表明,该方法可显著提高图像分割的速度和精度。  相似文献   

3.
子空间聚类问题是将一组原始无标签的数据按照一定的规则划分为不同类簇的过程,在模式识别、数据挖掘、计算机视觉以及生物信息学等诸多领域具有广泛的应用.然而,目前子空间聚类算法由于受到数据噪声和异常值的影响,性能仍不够理想.为更好刻画数据噪声和低秩性,本文结合两种capped范数,提出一种新的子空间聚类模型,并设计快速、有效的求解算法,同时给出其收敛性证明.数值实验表明,本文的算法比现有的一些经典算法在聚类性能上具有较明显的优势.  相似文献   

4.
聚类分析是当今飞速发展的数据挖掘和数据信息分析的一个重要技术,因此聚类分析已经成为数据挖掘领域一个非常活跃的研究课题.针对空间数据库对聚类算法的特殊要求,分析了空间聚类算法的构造思想及其优缺点,探讨了空间聚类算法目前的工作、算法的一些开放性问题以及今后的研究方向.  相似文献   

5.
在大数据时代,数据是由不同来源生成的,或者是从不同视图中观察得到的,这些数据被称为多视图数据。在数据挖掘与分析中,充分发挥知识在多视图数据中的作用是非常重要的,因此需要在融合相关数据的同时,考虑不同视图的多样性。近年来,多视图聚类(MvC)受到越来越多学者关注,根据其涉及的机制和原则,将多视图聚类算法分为5类,即协同训练算法、多核学习、多视图聚类、多视图子空间聚类与多任务多视图聚类。对多视图聚类算法进行介绍,并重点介绍了协同训练算法与多核学习。  相似文献   

6.
现有的增量聚类算法虽然解决了数据增量和类簇重叠问题,但在距离度量时没有考虑属性重要度不同,且普遍拥有较高的时间复杂度。针对以上问题,提出一种基于属性重要度的加权三支决策增量软聚类算法(W-TIOC-TWD算法),将属性重要度考虑到距离度量中,弥补了现有算法在聚类过程中将所有属性的重要程度视为相等的不足。该算法还引入离群点概念,降低了算法的时间复杂度。基于人工数据集和UCI数据集的实验结果表明,W-TIOC-TWD算法的聚类准确率优于比较算法。  相似文献   

7.
综合经济实力反映一个城市的经济发展水平.该文运用加权模糊聚类算法,评估城市综合经济实力,并改进了指标权重的算法,避免不同属性对分类贡献无差异的问题.结合权重与模糊聚类算法,分析评估方案运用加权模糊聚类算法,评估河南省各市综合经济实力,结果表明,运用加权模糊聚类算法评价城市综合经济实力有效.  相似文献   

8.
提出了一种基于核的聚类方法,增加对样本特征的优化;通过核函数,把数据样本空间映射到一个高维的特征空间;在特征空间对数据样本进行k-中心点聚类,并通过计算类内距离作为适应度准则,取其最优的结果。通过Web日志挖掘中的Web客户聚类应用比较,表明核聚类方法在性能上比经典的聚类算法有较大的改进,从而实现更为准确的聚类。  相似文献   

9.
提出使用文本相似度算法与DBSCAN聚类算法相结合的方法对文本进行聚类,实现对文本的管理。首先对文本进行特征提取和分词操作,在分词过程中会产生大量的特征词汇,而有些特征词汇对文本特征的表达并无实际意义。因此,在文本特征提取过程中根据特征词汇对文本特征表达的贡献度进行取舍,以提高文本聚类的效率和准确性。利用TF IDF方法对特征词汇进行加权,并且对文本进行相似度计算,将相似度低于阈值的文本作为孤立点进行处理。利用DBSCAN算法对文本进行聚类,将相似的文本聚为一类。  相似文献   

10.
针对功能磁共振成像(functional Magnetic Resonance Imaging,f MRI)数据的特点,在聚类fMRI数据时,两个体素之间的距离通常并非是一种简单的空间距离,而是和它们之间的相关程度有关的距离测度.在双曲相关系数(Hyperbolic Correlation Coefficient,HCC)距离度量基础上发展了一种新的距离测度,并提出了改进模糊聚类算法的定义、算法评价标准和算法参数的优化方法,然后将改进后的模糊聚类算法分别在任务态和静息态f MRI数据上与基于HCC距离度量的模糊聚类算法进行比较,最后通过比较结果证明改进后的模糊聚类算法具有较好的聚类效果和收敛速度.  相似文献   

11.
在现有蚁群算法的基础上,加入公式改进、半径递增、短期记忆、空间分割等策略,同时采用一种距离测度函数将数值特征与类属特征相结合,实现了混合属性数据的聚类.仿真实验表明,新算法能加快聚类速度,得到较好的聚类结果。  相似文献   

12.
K-means聚类算法研究   总被引:2,自引:0,他引:2  
聚类分析是模式识别中一个重要研究领域,是一种将数据划分或分组处理的重要手段和方法.K-means算法是聚类算法中主要算法之一,文章介绍了K-means聚类算法的实现方法,并对其优点和缺点进行了详细的分析.  相似文献   

13.
随着大数据时代的到来,聚类分析算法将面临如数据量巨大、数据维数增加等挑战,分布式处理是解决这类问题的方法之一.本研究将ROCK算法与Hadoop平台相结合,按照分布式处理原则,通过计算机集群模式去处理大规模的多样性数据.实验证明,在Hadoop平台下的ROCK聚类算法很大程度上提升了对高维数据进行聚类的能力.  相似文献   

14.
针对近年来基于网格和密度的数据聚类算法均需要先验知识确定聚类相关参数的问题,提出了基于动态网格和密度邻接的数据聚类算法。该算法首先分析数据集的特征,确定网格单元的初始值,通过定义全局距离度量函数,对网格单元进行2-1动态递减迭代,最后得到全局最优聚类。实验结果证明:使用该算法对数据进行聚类,能够获得直觉上的最优聚类结果。将该算法应用到对GPS信息聚类中,也得到较为理想的效果。  相似文献   

15.
提出一种将改进的核函数应用于土壤肥力研究的聚类方法。该方法在K-means聚类算法的基础上加入核函数,简化目标函数,将数据从低维空间映射到高维空间增加样本特征差异,同时提出相应选取参数的标准,提高聚类效果。实验表明,该算法对于非凸型数据或多维数据聚类正确率较高,具有良好的性能,能较好地反映土壤肥力指标和土壤利用的关系,可使土壤肥力的发展与作物的需求达到协调一致的状态,保障农作物的高产稳产。  相似文献   

16.
近年来,数据挖掘技术的研究备受国内外关注,其主要原因是信息技术发展产生了大量分散的数据,迫切需要将这些数据转换成有用的信息和知识.此前的研究,主要集中于分类算法及应用方面的研究,但某些特殊领域,如生物信息学研究等,需要通过聚类方法解决一些实际问题.本文从横向深入分析了数据挖掘技术中聚类算法的发展,对层次法、划分法、模糊法,以及量子聚类、核聚类,基于密度和网格等10种聚类算法的原理、过程和特点等都进行了比较详细的分析论述.  相似文献   

17.
K-Means算法是聚类方法中常用的一种划分方法。随着数据量的增加,K-Means算法的局限性日益突出。基于网格划分的思想,提出了一种基于网格的K-Means聚类算法,该算法使用了网格技术在一定程度上去除了孤立点和噪声数据,减少了原始K-Means算法将大的聚类分开的可能。实验表明,该算法能处理任意形状和大小的聚类,对孤立点和噪声数据也能很好地识别,并且在去除孤立点和噪声数据方面可以达到较好的精度。  相似文献   

18.
介绍和比较了现有的空间聚类算法,并改进了基于密度的DBSCAN算法,该算法大大减少了I/O开销,更适合高维空间数据库的数据聚类。  相似文献   

19.
随着网络的普及和信息量的急剧增加,从海量数据中提取有用的数据信息已迫在眉睫。本文提出了一种基于密度偏差抽样的聚类算法,实验表明,随着信息量、数据维数的增加,该算法聚类的正确率以及对数据的处理速度都要较传统的聚类算法有所提高。  相似文献   

20.
层次聚类算法是一类重要的聚类分析方法。传统的层次聚类算法的时间为O(n2)空间复杂度很大,这使得聚类分析在大型数据集上的应用受到限制。该文提出一种基于分治递推改进算法,该算法将大大减少算法的时间复杂度和空间复杂度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号