共查询到20条相似文献,搜索用时 250 毫秒
1.
连续属性离散化问题是机器学习的重要方面,是数据预处理问题之一。文章提供的基于粗糙集的层次聚类算法(RAHCA)是对层次聚类算法的一种改进,它能够自动调整参数,以寻求更优的聚类结果。实验结果验证了该算法的可行性,特别是在符号属性聚类方面有着较好的聚类性能。 相似文献
2.
K-means算法在聚类过程中随机选取k个初始聚类中心,容易造成聚类结果不稳定。针对该问题,提出PCA-TDKM算法:使用主成分分析法对数据对象集合的属性进行降维,提取出主属性,去掉无关属性,从而加速聚类过程;基于最小生成树算法及树的剪枝方法将数据对象划分为k个初始聚类簇,然后进行剪枝生成k棵子树,计算每棵子树中所有数据对象的均值,作为初始聚类中心;利用基于密度与最大最小距离的算法思想进行聚类。将PCA-TDKM算法与K-means、KNE-KM、QMC KM、CFSFDP-KM在UCI数据集上进行聚类比较,结果表明该算法聚类结果稳定、聚类准确率高。 相似文献
3.
4.
5.
张水波 《闽西职业技术学院学报》2012,14(4):117-120
人脸识别技术是图像处理方面的重要技术。通过对人脸数据进行标准化处理,利用主成分分析和半监督模糊聚类算法对人脸数据库进行聚类分析。实验结果表明,半监督模糊聚类利用主成分降维得到的22个特征进行聚类,对于已知类别属性的人脸,聚类结果与这些属性的一致率达100%,而对于其他数据,一致率也达到99%以上。 相似文献
6.
李玲玲 《贵州教育学院学报》2011,(9):11-14
凝聚型层次聚类和模糊C-均值聚类是聚类中的两种常用算法,每种算法都有其自己的优点、缺点及适用的对象和范围。针对FCM算法的对初始值敏感,以及目标函数没有考虑类间距离的缺点,通过使用距离阚值,把凝聚型层次聚类与模糊C-均值聚类算法相结合,产生一种新的基于距离闲值的FCM算法,实验结果表明。这种算法能够自动的判断迭代的终止条件、快速有效的找到最佳聚类结果,从而实现对模糊C-均值聚类算法的自动优化。 相似文献
7.
8.
基于层次的模糊K均值聚类算法研究 总被引:1,自引:0,他引:1
苏瑞 《安阳师范学院学报》2010,(2):47-50
通过对K均值聚类算法的研究,本文提出了一种基于层次聚类与模糊聚类思想的K均值聚类算法。算法首先使用层次方法对数据进行初始聚类,然后用得到的聚类数作为模糊K均值聚类中的K值,对聚类进行修正。最后通过实验,验证了该算法不需要人为假设聚类算法中的K值,而且引入了模糊隶属关系使类别的划分更接近于事实,从而证明了该算法的有效性。 相似文献
9.
聚类分析中相似性测量方法的研究 总被引:1,自引:0,他引:1
易华容 《株洲师范高等专科学校学报》2002,7(2):43-46
聚类是数据挖掘中的主要方法 .讨论了在大多数聚类算法中的相似性测量方法 ,并以属性的类型作为选择相似性的标准 ,阐述了用于数值属性 ,符号属性及混合属性相似性测量方法 . 相似文献
10.
李艳虹 《重庆职业技术学院学报》2015,24(3)
综合经济实力反映一个城市的经济发展水平.该文运用加权模糊聚类算法,评估城市综合经济实力,并改进了指标权重的算法,避免不同属性对分类贡献无差异的问题.结合权重与模糊聚类算法,分析评估方案运用加权模糊聚类算法,评估河南省各市综合经济实力,结果表明,运用加权模糊聚类算法评价城市综合经济实力有效. 相似文献
11.
聚类是发现数据分布和隐含模式的一项重要技术,但单一的聚类算法很难达到预期的效果.基于四种聚类算法,根据算法准确率,利用层次分析法以估计权重,构造一个基于四类算法融合的聚类器,经实验检验,该聚类器比单一聚类器的聚类效果好. 相似文献
12.
刘园园 《青岛职业技术学院学报》2010,23(3):52-54,67
针对聚类算法易陷入局部优化的缺点,将中心定位算子遗传算法与层次聚类方法动态结合,通过遗传算法的全局寻优特点弥补层次聚类算法的不足.在算法的后期融入Chameleon思想,提高了算法的准确性.通过对UCI中的三个数据集样本进行测试,表明聚类效果优于传统聚类方法. 相似文献
13.
差分隐私是能够提供严谨数学证明的隐私保护模型,针对传统差分隐私保护方法在混合型数据集中应用效果差、处理后破坏数据可用性等问题,提出一种面向混合型数据集自适应聚类的差分隐私保护算法.结合快速聚类及k-prototype聚类算法的特点,首先根据混合数据集的不同数据类型属性,采用不同的相异度计算方式实现对不同数据类型属性的距... 相似文献
14.
近年来,数据挖掘技术的研究备受国内外关注,其主要原因是信息技术发展产生了大量分散的数据,迫切需要将这些数据转换成有用的信息和知识.此前的研究,主要集中于分类算法及应用方面的研究,但某些特殊领域,如生物信息学研究等,需要通过聚类方法解决一些实际问题.本文从横向深入分析了数据挖掘技术中聚类算法的发展,对层次法、划分法、模糊法,以及量子聚类、核聚类,基于密度和网格等10种聚类算法的原理、过程和特点等都进行了比较详细的分析论述. 相似文献
15.
张浩 《温州职业技术学院学报》2013,(1):84-86
在传统聚类模型的基础上,提出一种基于向量空间模型的层次聚类算法,用于文本数据的挖掘。实验结果表明,基于向量空间模型的层次聚类算法从挖掘的准确率上更具有性能优势。 相似文献
16.
提出了一种半监督模糊聚类算法,给出了它的迭代公式,指出该算法可以有效提高聚类算法的效率.结合Fisher降维方法,从叶片的色调、绿色灰度的18个特征中提取出两个主分量,并采用这些二维数据对羊蹄甲角斑病的受害程度作聚类分析.结果显示,对40张使用了其类别属性参与聚类的叶片,聚类结果与这些属性的一致率达100%,而对于其他数据,一致率也达到95%以上. 相似文献
17.
K-means算法是解决聚类问题的经典算法,在满足一定的条件情况下,聚类的结果比较好.但这种算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动.针对这种缺陷,提出了一种新的基于数据样本分布选取初始聚类中心的算法. 相似文献
18.
K-means算法是聚类分析划分方法中的一种常用方法,也是目前在数据分析方法中最有应用前景的方法之一。但K mean算法对初始聚类中心十分敏感,这对处理学生成绩等数据而言,会导致聚类结果极为不稳定。为此,提出基于改进遗传算法的K means聚类算法。该算法利用遗传算法解决初始聚类中心,提高聚类结果的稳定性,但存在前期过早收敛和后期收敛过慢的缺点。将改进遗传K means聚类算法应用于高职高专的学生考试成绩分析中,可以很好地解决传统遗传聚类算法对聚类结果的不稳定性问题,并通过聚类结果对学生考试成绩进行分类评价,利用所获得的数据聚类结果指导教学,从而提高教学质量。 相似文献
19.
对单属性时态特征聚类进行了研究,提出了一种基于SOM网络(自组织特征映射)聚类提取单属性时态数据特征的方法,通过实验表明此算法是有效的. 相似文献
20.
层次聚类算法是一类重要的聚类分析方法。传统的层次聚类算法的时间为O(n2)空间复杂度很大,这使得聚类分析在大型数据集上的应用受到限制。该文提出一种基于分治递推改进算法,该算法将大大减少算法的时间复杂度和空间复杂度。 相似文献