首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 250 毫秒
1.
李晓飞  李好 《唐山学院学报》2010,(3):44-44,45,46
连续属性离散化问题是机器学习的重要方面,是数据预处理问题之一。文章提供的基于粗糙集的层次聚类算法(RAHCA)是对层次聚类算法的一种改进,它能够自动调整参数,以寻求更优的聚类结果。实验结果验证了该算法的可行性,特别是在符号属性聚类方面有着较好的聚类性能。  相似文献   

2.
K-means算法在聚类过程中随机选取k个初始聚类中心,容易造成聚类结果不稳定。针对该问题,提出PCA-TDKM算法:使用主成分分析法对数据对象集合的属性进行降维,提取出主属性,去掉无关属性,从而加速聚类过程;基于最小生成树算法及树的剪枝方法将数据对象划分为k个初始聚类簇,然后进行剪枝生成k棵子树,计算每棵子树中所有数据对象的均值,作为初始聚类中心;利用基于密度与最大最小距离的算法思想进行聚类。将PCA-TDKM算法与K-means、KNE-KM、QMC KM、CFSFDP-KM在UCI数据集上进行聚类比较,结果表明该算法聚类结果稳定、聚类准确率高。  相似文献   

3.
相比较于其它聚类算法,密度峰值聚类算法可将任意形状的数据与较少的参数和高效的聚类速度结合起来。针对当某个类中出现多个密度峰值时,聚类结果缺乏准确性的问题,提出一种改进的密度峰值聚类结果有效性造成的影响,算法通过比较类簇之间的密度属性,实现动态的子簇合并,减少主观因素对算法结果的影响。通过实验与已有密度聚类算法对比,改进算法不仅很好地避免了原算法人为确定参数给实验结果造成的影响,而且具有更好的聚类性能。  相似文献   

4.
现有的增量聚类算法虽然解决了数据增量和类簇重叠问题,但在距离度量时没有考虑属性重要度不同,且普遍拥有较高的时间复杂度。针对以上问题,提出一种基于属性重要度的加权三支决策增量软聚类算法(W-TIOC-TWD算法),将属性重要度考虑到距离度量中,弥补了现有算法在聚类过程中将所有属性的重要程度视为相等的不足。该算法还引入离群点概念,降低了算法的时间复杂度。基于人工数据集和UCI数据集的实验结果表明,W-TIOC-TWD算法的聚类准确率优于比较算法。  相似文献   

5.
人脸识别技术是图像处理方面的重要技术。通过对人脸数据进行标准化处理,利用主成分分析和半监督模糊聚类算法对人脸数据库进行聚类分析。实验结果表明,半监督模糊聚类利用主成分降维得到的22个特征进行聚类,对于已知类别属性的人脸,聚类结果与这些属性的一致率达100%,而对于其他数据,一致率也达到99%以上。  相似文献   

6.
凝聚型层次聚类和模糊C-均值聚类是聚类中的两种常用算法,每种算法都有其自己的优点、缺点及适用的对象和范围。针对FCM算法的对初始值敏感,以及目标函数没有考虑类间距离的缺点,通过使用距离阚值,把凝聚型层次聚类与模糊C-均值聚类算法相结合,产生一种新的基于距离闲值的FCM算法,实验结果表明。这种算法能够自动的判断迭代的终止条件、快速有效的找到最佳聚类结果,从而实现对模糊C-均值聚类算法的自动优化。  相似文献   

7.
仿射传播聚类算法是一种比较新的基于质心的聚类算法,在图像分割领域得到了广泛应用。仿射传播聚类算法最终聚类数目会受到偏向参数P(Preference)的影响,得到的聚类数目往往偏多,影响分割质量。鉴于此,提出一种改进的仿射传播聚类的图像分割算法,该算法将仿射传播聚类算法与CURE层次聚类算法相结合,CURE算法能够对仿射传播聚类算法的分割结果进行优化。实验验证表明,改进后的算法图像分割效果更好。  相似文献   

8.
基于层次的模糊K均值聚类算法研究   总被引:1,自引:0,他引:1  
通过对K均值聚类算法的研究,本文提出了一种基于层次聚类与模糊聚类思想的K均值聚类算法。算法首先使用层次方法对数据进行初始聚类,然后用得到的聚类数作为模糊K均值聚类中的K值,对聚类进行修正。最后通过实验,验证了该算法不需要人为假设聚类算法中的K值,而且引入了模糊隶属关系使类别的划分更接近于事实,从而证明了该算法的有效性。  相似文献   

9.
聚类分析中相似性测量方法的研究   总被引:1,自引:0,他引:1  
聚类是数据挖掘中的主要方法 .讨论了在大多数聚类算法中的相似性测量方法 ,并以属性的类型作为选择相似性的标准 ,阐述了用于数值属性 ,符号属性及混合属性相似性测量方法 .  相似文献   

10.
综合经济实力反映一个城市的经济发展水平.该文运用加权模糊聚类算法,评估城市综合经济实力,并改进了指标权重的算法,避免不同属性对分类贡献无差异的问题.结合权重与模糊聚类算法,分析评估方案运用加权模糊聚类算法,评估河南省各市综合经济实力,结果表明,运用加权模糊聚类算法评价城市综合经济实力有效.  相似文献   

11.
聚类是发现数据分布和隐含模式的一项重要技术,但单一的聚类算法很难达到预期的效果.基于四种聚类算法,根据算法准确率,利用层次分析法以估计权重,构造一个基于四类算法融合的聚类器,经实验检验,该聚类器比单一聚类器的聚类效果好.  相似文献   

12.
针对聚类算法易陷入局部优化的缺点,将中心定位算子遗传算法与层次聚类方法动态结合,通过遗传算法的全局寻优特点弥补层次聚类算法的不足.在算法的后期融入Chameleon思想,提高了算法的准确性.通过对UCI中的三个数据集样本进行测试,表明聚类效果优于传统聚类方法.  相似文献   

13.
差分隐私是能够提供严谨数学证明的隐私保护模型,针对传统差分隐私保护方法在混合型数据集中应用效果差、处理后破坏数据可用性等问题,提出一种面向混合型数据集自适应聚类的差分隐私保护算法.结合快速聚类及k-prototype聚类算法的特点,首先根据混合数据集的不同数据类型属性,采用不同的相异度计算方式实现对不同数据类型属性的距...  相似文献   

14.
近年来,数据挖掘技术的研究备受国内外关注,其主要原因是信息技术发展产生了大量分散的数据,迫切需要将这些数据转换成有用的信息和知识.此前的研究,主要集中于分类算法及应用方面的研究,但某些特殊领域,如生物信息学研究等,需要通过聚类方法解决一些实际问题.本文从横向深入分析了数据挖掘技术中聚类算法的发展,对层次法、划分法、模糊法,以及量子聚类、核聚类,基于密度和网格等10种聚类算法的原理、过程和特点等都进行了比较详细的分析论述.  相似文献   

15.
在传统聚类模型的基础上,提出一种基于向量空间模型的层次聚类算法,用于文本数据的挖掘。实验结果表明,基于向量空间模型的层次聚类算法从挖掘的准确率上更具有性能优势。  相似文献   

16.
提出了一种半监督模糊聚类算法,给出了它的迭代公式,指出该算法可以有效提高聚类算法的效率.结合Fisher降维方法,从叶片的色调、绿色灰度的18个特征中提取出两个主分量,并采用这些二维数据对羊蹄甲角斑病的受害程度作聚类分析.结果显示,对40张使用了其类别属性参与聚类的叶片,聚类结果与这些属性的一致率达100%,而对于其他数据,一致率也达到95%以上.  相似文献   

17.
K-means算法是解决聚类问题的经典算法,在满足一定的条件情况下,聚类的结果比较好.但这种算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动.针对这种缺陷,提出了一种新的基于数据样本分布选取初始聚类中心的算法.  相似文献   

18.
K-means算法是聚类分析划分方法中的一种常用方法,也是目前在数据分析方法中最有应用前景的方法之一。但K mean算法对初始聚类中心十分敏感,这对处理学生成绩等数据而言,会导致聚类结果极为不稳定。为此,提出基于改进遗传算法的K means聚类算法。该算法利用遗传算法解决初始聚类中心,提高聚类结果的稳定性,但存在前期过早收敛和后期收敛过慢的缺点。将改进遗传K means聚类算法应用于高职高专的学生考试成绩分析中,可以很好地解决传统遗传聚类算法对聚类结果的不稳定性问题,并通过聚类结果对学生考试成绩进行分类评价,利用所获得的数据聚类结果指导教学,从而提高教学质量。  相似文献   

19.
对单属性时态特征聚类进行了研究,提出了一种基于SOM网络(自组织特征映射)聚类提取单属性时态数据特征的方法,通过实验表明此算法是有效的.  相似文献   

20.
层次聚类算法是一类重要的聚类分析方法。传统的层次聚类算法的时间为O(n2)空间复杂度很大,这使得聚类分析在大型数据集上的应用受到限制。该文提出一种基于分治递推改进算法,该算法将大大减少算法的时间复杂度和空间复杂度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号