首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
聚类分析在数据挖掘领域中占有重要地位,到目前为止学者们提出了许多的聚类算法.本文提出了一种基于k NN的聚类算法k-Nearest Neighbor Cluster(k NNC).该算法首先找到每个数据点的k个邻居点,然后设置匹配点数n,通过使用每个点的邻居点进行匹配进而达到聚类效果.本文通过三个实验去验证该算法,并且与k-means算法进行比较.实验结果表明,该算法具有稳定的正确率,而其最大的优点是不需要预先设定聚类簇数,它可以大致的找到聚类的簇数.  相似文献   

2.
模糊C均值聚类是聚类分析中应用最广泛的算法之一,但是聚类数目需要人为预先设定,在实际应用中有极大的局限性。提出一种自动确定聚类数目的基于粒子群的模糊C均值聚类算法,通过对不同聚类数目进行试验,利用添加粒子阈值向量自动确定最佳的聚类数目。在预设的最大聚类数目内随机分割数据集,利用重构准则重新构建初始值,以此克服需要事先设置聚类数目的模糊C均值缺点。利用有效性函数评估算法性能,试验结果表明,该算法能自动找到最优聚类数目,聚类效果很好。  相似文献   

3.
一种改进的k-means聚类算法   总被引:2,自引:0,他引:2  
针对k-means算法事先必须获知聚类数目以及难以确定初始中心的缺点,提出了一种改进的k-means聚类算法.首先引入轮廓系数的概念,通过计算不同K值下簇集中各对象的轮廓系数确定事先未知分类信息的数据集中所包含的最优聚类数Kopt;然后通过凝聚层次聚类的方法获得数据集的分布,确定初始聚类中心;最后利用传统的k-means方法完成聚类.理论分析表明,所提出的算法具有适度的计算复杂度.IRIS测试数据集的实验结果表明了该算法能够合理区分不同类型的簇集,且可以有效地识别离群点,聚合后的结果簇集具有较低的熵值.  相似文献   

4.
传统K中心点算法虽然改进了K均值算法对噪声和孤立点数据敏感的不足,但是仍存在着初始聚类中心和聚类个数k难以确定的问题,因此,针对算法存在的问题,提出一种基于密度的改进K中心点算法。该算法会根据数据集数据的分布情况自主确定聚类个数k和k个聚类中心点。最后,通过在入侵检测领域KDD Cup99数据集上实验测试表明,改进K中心点算法不仅能够自动形成k个聚类,而且具有较高的入侵检测率和较低的漏报率,聚类和入侵检测的效果均优于传统的K中心点算法。  相似文献   

5.
提出了一个微粒群优化算法(autoPSO)自动聚类高维数据。autoPSO优化了Davies-Bouldin(DB)有效性函数,并将聚类问题转化为一个界约束的连续函数的优化问题。用一个实数矩阵和一个二进制向量来表示微粒,使得同一迭代中能够表示具有不同聚类数目的划分;并且,在二进制向量的控制下指导相关联的实数矩阵交叉操作,保持算法良好的种群多样性,避免算法早熟收敛。通过高维模拟数据集的实验结果表明,本文算法不需要预设聚类数目k,能够自动正确识别高维数据的聚类。  相似文献   

6.
提出了一种基于改进蚁群算法的动态K-均值聚类算法思想。该算法首先利用蚁群算法较强处理局部极值的能力,动态地确定了聚类数目和中心,然后利用蚁群聚类得到的结果,进行K-均值聚类弥补蚁群算法的不足。两者的有机结合可以寻求到具有全局分布特性的最优聚类,实现基于改进的蚁群聚类算法分析。  相似文献   

7.
仿射传播聚类算法是一种比较新的基于质心的聚类算法,在图像分割领域得到了广泛应用。仿射传播聚类算法最终聚类数目会受到偏向参数P(Preference)的影响,得到的聚类数目往往偏多,影响分割质量。鉴于此,提出一种改进的仿射传播聚类的图像分割算法,该算法将仿射传播聚类算法与CURE层次聚类算法相结合,CURE算法能够对仿射传播聚类算法的分割结果进行优化。实验验证表明,改进后的算法图像分割效果更好。  相似文献   

8.
根据目前应用于入侵监测的算法中普遍存在的对输入顺序敏感,无法自适应地确定参数以及需要大量的训练数据等问题,且k-means算法存在初值选取的问题,因而提出一种新的聚类算法进行入侵行为的监测.该方法的优点是对输入数据顺序不敏感以及能够比较准确地选择聚类的初值.实验中采用了KDD99的测试数据 ,结果表明该方法可以比较有效地检测真实网络数据中的已知和未知的入侵行为.  相似文献   

9.
聚类分析已成为数据挖掘研究中非常活跃的研究课题,在聚类分析方法中,基于模型的算法由于考虑到“噪声”或异常数据,可以自动确定聚类个数,可以产生鲁棒的聚类方法,而成为领域研究的一个重点。本文主要对神经网络中的竞争学习神经网络、SOFM 神经网络方法、统计学聚类方法研究。  相似文献   

10.
提出了一种基于改进蚁群算法的动态K-均值聚类算法思想,该算法首先利用蚁群算法的较强处理局部极值的能力,动态地确定了聚类数目和中心,然后利用蚁群聚类得到的结果,再进行K-均值聚类弥补蚁群算法的不足。两者有机结合起来可以寻求到具有全局分布特性的最优聚类,实现了基于改进的蚁群聚类算法分析。  相似文献   

11.
将一种基于聚类算法的RBF(径向基函数)神经网络方法运用于入侵检测中。在这种方法中采用两阶段学习方法,在利用非监督学习算法确定网络隐层中心时,提出一种基于高斯基的距离度量,并联合输入输出聚类的策略。基于F isher可分离率设计高斯基距离量度中的惩罚因子,可以提高聚类的性能。通过构建入侵检测模型,一方面可以加速网络训练速度,另一方面可以提高入侵检测在预测误报漏报中的性能。  相似文献   

12.
提出一种结合二维PCA和二维LDA的降维方法,并将方法应用于人脸识别研究.对传统的半监督模糊聚类算法进行改造,使之可以直接用于二维数据矩阵进行动态聚类,并据此设计了一种动态学习算法.实验结果表明,与其他降维方法和聚类算法比较,这种结合了二维LDA的半监督聚类模型具有更好的识别率.  相似文献   

13.
论文提出了一种基于蚁群动态模糊聚类算法的计算机图像分割方法,有效地利用蚁群算法的聚类分析能力,克服了FCM算法对初始化的敏感,动态地确定了聚类数目和中心。然后利用蚁群聚类算法得到的模型进行修改,再进行模糊聚类弥补蚁群算法的不足。最后将该算法应用到计算机图像分割技术。对比实验表明,该算法实验表明该算法速度快、划分特性好,可以准确地分割出目标。  相似文献   

14.
传统的集中式聚类算法不适宜对传感器网络的分布式数据进行聚类,用遗传进化机制对传统k-means的分布式聚类算法进行优化,可得出遗传k-means聚类算法。遗传k-means聚类算法即在传感器网络中sink节点传送随机选取的初始k个簇心到各个传感器节点,在这些节点上分别用遗传k-means聚类算法将本地的数据划分到距离最近的簇,然后将簇信息在无线传感器网络里通过路由逐层上传合并汇聚到sink节点,计算k个簇心的平均值,再往下传送k个簇心,反复迭代更新直至聚类目标函数值达到最小为止。实验表明,遗传k-means聚类算法的聚类效果较好,收敛速度较快。  相似文献   

15.
基于迭代自组织数据聚类阈值的脉冲耦合神经网络的图像分割算法改进了传统脉冲耦合神经网络在图像分割中由于不恰当的参数选择而导致图像欠分割和过分割的问题.基于迭代自组织数据聚类阈值的脉冲耦合神经网络图像分割算法无需确定参数和循环次数,也不需要用特定原则确定循环结束的条件,只需利用图像中的每个像素点的灰度值进行聚类,然后利用改进的迭代自组织数据算法确定图像的初始聚类数目以及聚类中心,并以此作为脉冲耦合神经网络的最佳阈值,一次点火过程自动完成分割.实验结果表明,这种算法具有较好的分割结果和分割速度,提高了分割的准确性.  相似文献   

16.
不同的聚类算法都可以完成对无标签数据的分类,而Kmeans聚类算法是一种无监督静态数据分析机器学习方法,已被广泛应用于机器学习、模式识别、数据挖掘等领域.但对维度数据准确率不高,本文引入深度自动编码器完成对输入样本的特征自动学习和重构,实现对数据的降维和特征提取,代替原始数据通过Kmeans算法进行聚类分析.实验结果证明,改进后的AE Kmeans(Auto Encoder Kmeans)算法与单独使用Kmeans算法完成聚类相比,准确率得到明显提高.  相似文献   

17.
针对数据真实的概率分布不符合事先假设的高斯混合模型的情形,提出了一种鲁棒的基于高斯混合模型的聚类方法.首先,提出了一种新的模型选择准则,即完整似然最短信息长度准则.该准则不仅能衡量模型对数据的拟合优度,还能度量该模型对数据分组的性能.然后,将该准则作为聚类的代价函数,提出了一种新的期望最大化算法来估计模型参数.与标准的期望最大化算法相比,新算法能较好地避免不理想的局部最优解.实验结果表明:当数据概率分布模型不符合假设的高斯混合模型时,所提方法可克服现有的基于高斯混合模型聚类方法过拟合的缺点,鲁棒地得到准确的聚类结果.  相似文献   

18.
K-means算法在聚类过程中随机选取k个初始聚类中心,容易造成聚类结果不稳定。针对该问题,提出PCA-TDKM算法:使用主成分分析法对数据对象集合的属性进行降维,提取出主属性,去掉无关属性,从而加速聚类过程;基于最小生成树算法及树的剪枝方法将数据对象划分为k个初始聚类簇,然后进行剪枝生成k棵子树,计算每棵子树中所有数据对象的均值,作为初始聚类中心;利用基于密度与最大最小距离的算法思想进行聚类。将PCA-TDKM算法与K-means、KNE-KM、QMC KM、CFSFDP-KM在UCI数据集上进行聚类比较,结果表明该算法聚类结果稳定、聚类准确率高。  相似文献   

19.
流数据是近年来关注比较多的一种数据形式,但由于它自身的特点,无法使用传统的算法对它进行聚类分析.数据挖掘是从大规模数据库中提取感兴趣的信息.聚类是数据挖掘的重要工具,它根据数据间的相似性将数据库分成多个类,每类中数据要求尽可能相似.针对流数据的特点,引入一种采用渔夫捕鱼策略的新的聚类算法.该算法采用动态多点随机投鱼网方法,并且根据捕鱼环境的不同采用不同的探测策略.流数据聚类的捕鱼算法是一种即时更新模型的在线聚类算法.  相似文献   

20.
K-means算法是解决聚类问题的经典算法,在满足一定的条件情况下,聚类的结果比较好.但这种算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动.针对这种缺陷,提出了一种新的基于数据样本分布选取初始聚类中心的算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号