首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
为处理线性不可分、结构复杂的数据集,提出基于核聚类的K 均值聚类(Kernel Clustering based K means Clustering,KCKC).该方法先在原始空间中对模式进行聚类,再由径向基函数(Radial Basis Function, RBF)核把它们映射到核空间,从而保持大部分模式之间的关系.把提出的方法应用到基于RBF的神经网络(RBF based Neural Network,RBFNN)、基于RBF的支持向量机(RBF based Support Vector Machine, RBFSVM)和核最近邻分类器(Kernel Nearest Neighbor Classifier,KNNC)中,结果表明本文提出的算法可以生成更有效的核,节省在核空间中的核生成时间,避免核数目设置的敏感性,并提高分类性能.  相似文献   

2.
为解决原始核聚类(Kernel Clustering, KC)中模式信息不足、聚类结果不佳的缺点,以KC为基础,利用Universum学习带来的优势,提出基于Universum学习的核聚类(Universum learning based Kernel Clustering, UKC)方法.首先利用Universum学习生成相应的Universum模式,再利用KC算法把数据集分割成多个簇,最后利用每个簇中所包含的Universum模式和训练模式来更新该簇,从而使得这些簇更加合理.实验表明,该算法可以更好地改善聚类效果和分类器的分类性能、泛化能力和计算效率.虽然该方法的步骤比KC多,但是其较好的聚类性能可以帮助人们处理分类问题.  相似文献   

3.
为弥补具有径向基函数(radial basis function, RBF)核的支持向量机(support vector machine, SVM)的不足,即如何获得合适的RBF核并且包含更多的数据信息,提出一个关于核聚类的有效方法。该方法通过关于核数目、中心、宽度的一些公式来生成核。这个生成方法可以容易、合理、优化地获得核。在美国邮政手写数字数据集(记为USPS)和字母识别数据集(记为Letter)上的试验可以验证,具有这些新生成的RBF核的SVM拥有更少更合理的核以及更高的分类性能。通过这个新提出的方法,可以处理更多的大规模分类问题。  相似文献   

4.
为弥补具有径向基函数(radial basis function,RBF)核的支持向量机(support vector machine,SVM)的不足,即如何获得合适的RBF核并且包含更多的数据信息,提出一个关于核聚类的有效方法。该方法通过关于核数目、中心、宽度的一些公式来生成核。这个生成方法可以容易、合理、优化地获得核。在美国邮政手写数字数据集(记为USPS)和字母识别数据集(记为Letter)上的试验可以验证,具有这些新生成的RBF核的SVM拥有更少更合理的核以及更高的分类性能。通过这个新提出的方法,可以处理更多的大规模分类问题。  相似文献   

5.
提出了一种结合了基于密度聚类思想的划分聚类方法——"密度最大值聚类算法(MDCA)",以最大密度对象作为起始点,通过考察最大密度对象所处空间区域的密度分布情况来划分基本簇,并合并基本簇获得最终的簇划分.实验表明,MDCA能够自动确定簇数量,并有效发现任意形状的簇,对于未知数据集的处理能力和聚类准确度都优于传统的基于划分聚类算法.  相似文献   

6.
聚类是空间数据挖掘的主要技术之一 ,目前空间数据库的应用日益广泛 ,但空间数据有许多不同于关系数据库的特征。所以把已有的聚类算法应用到大型空间数据库中有许多缺点 ,且效率很低。因此必须借助高效的索引技术来提高空间数据的处理效率。  相似文献   

7.
提出一种基于最近邻居距离分布的空间聚类算法——NNDDB算法.实验分析表明,与划分聚类算法CLARANS相比,NNDDB能动态地决定聚类数目且能发现任意形状的聚类;与密度聚类算法DBSCAN相比,NNDDB算法无输入参数;在效率方面,NNDDB算法对于大型数据库是有效的.  相似文献   

8.
为了从大量含噪的航运信息中挖掘出有用的知识,研究孤立点探测方法在航运信息处理中的应用.首先在对k-means聚类算法分析的基础上,定义中位数的概念及孤立点的判断标准,提出一种基于k-means聚类的孤立点分析算法;然后,针对航运信息的特点,采用一维数据和多维数据异常点探测方法挖掘AIS数据库中的异常信息.实验结果证明,基于k-means聚类的算法对孤立点更敏感,能够探测到一维统计方法中探测不到的异常点  相似文献   

9.
使用调和均值的KHM聚类算法,不像KM聚类算法,具有对初始值不敏感的优点。但它作为一个基于中心聚类算法,难以摆脱早熟收敛的问题。为了克服KHM算法的不足,本文提出结合ABC和KHM的ABC-KHM混合聚类算法。在混合算法中,聚类行为可以分为两个阶段:全局搜索的ABC聚类阶段和局部求精的KHM聚类阶段。通过仿真实验,并与KHM聚类算法进行了比较,结果表明:ABC-KHM混合聚类算法,不仅对聚类初始值不敏感,而且具有较快的聚类速度、良好的全局聚类效果,是一个不错的聚类算法。  相似文献   

10.
提出了加权的系统聚类方法.该方法通过对不同的客户特征赋予不同的权重,达到对客户的聚类结果更符合企业经营目标的目的.为分析客户特征的权重,利用线性回归挖掘企业的历史数据,得到物流企业对客户各个特征的重视程度,并把重视程度作为权重进行客户聚类.实验分析表明,与传统的系统聚类相比,加权的系统聚类方法可以发现隐藏在一般客户中的重要客户,从而使物流企业对本公司的重要客户提供优质服务.  相似文献   

11.
针对由于地形起伏、地物类型丰富等因素导致一般配准方法无法正确拟合遥感影像局部区域的问题,提出一种基于特征信息层次聚类对影像区域快速划分实现精细拟合的方法。该方法利用差分空间尺度约束提取更高精度的SIFT的特征点,并结合Hellinger变换优化匹配效率,完成特征粗匹配。根据点邻域信息完成初始聚类,得到变换模型;计算匹配点对不同变换模型的符合程度构建倾向集,根据距离合并集合得到聚类中心,使用泰森多边形法生成子区域。求解每个子区域的变换模型并插值拼接,得到配准结果。使用农田、山地、沿海城镇地形的遥感影像进行实验,将SIFT+ST、FSC-SIFT、PSO-SIFT方法的配准效果与该方法进行对比,结果表明该方法的精度与目视配准效果均更优。  相似文献   

12.
文本聚类是建立大规模文本集合的分类体系实例的有效手段之一。本文讨论了利用标准的分类测试集合进行聚类质量的量化评价的手段,选择了k-Means聚类算法、STC(后缀树聚类)算法和基于Ant的聚类算法进行了实验对比。对实验结果的分析表明,STC聚类算法由于在处理文本时充分考虑了文本的短语特性,其聚类效果较好;基于Ant的聚类算法的结果受参数输入的影响较大;在Ant聚类算法中引入文本特性可以提高聚类结果的质量。  相似文献   

13.
本文详细分析了数据流聚类算法CluStream的不足之处,如对非球形的聚类效果不好、对周期性数据的聚类变化反映不完整等,并针对这些不足提出了一种采用空间分割、组合以及按密度聚类的算法SClustream。实验结果表明,SCluStream在准确度和速度上都比CluStream有较大的提高。  相似文献   

14.
基于内容的非结构化P2P搜索系统中直接影响查询效果和搜索成本的两个主要问题是,高维语义空间所引起的文本相似度计算复杂以及广播算法带来的大量冗余消息. 本文提出利用集合差异度实现基于内容聚类的P2P搜索模型提高查询效率和减少冗余消息。该模型利用集合差异度定义文本相似度,将文本相似性的计算复杂度控制在线性时间内而有效地减少了查询时间;利用节点之间的集合差异度实现基于内容的聚类,既降低了查询时间,又减少了冗余消息.模拟实验表明,利用集合差异度构建的基于内容的搜索模型不仅具有较高的召回率,而且将搜索成本和查询时间分别降低到了Gnutella系统的40%和30%左右.  相似文献   

15.
DBSCAN是一种经典的基于密度聚类算法,能够自动确定簇的数量,对任意形状的簇都能有效处理.DBSCAN算法需要人为确定Eps和minPts?2个参数,导致聚类过程需人工干预才能进行.在DBSCAN的基础上提出了SA-DBSCAN聚类算法,通过分析数据集统计特性来自动确定Eps和minPts参数,从而避免了聚类过程的人工干预,实现聚类过程的全自动化.实验表明,SA-DBSCAN能够选择合理的Eps和minPts参数并得到较高准确度的聚类结果.  相似文献   

16.
提出了KPCA的一种称为联合核主成分分析(Joint Kernel Principle Component Analysis,JKPCA)的变型,能够从输入和输出空间引出先验信息用于特征提取.首次将联合核映射应用于特征提取领域,而且在图像数据集上的实验结果表明,JKPCA是可行并有效的.  相似文献   

17.
为解决船舶自动识别系统(automatic identification system, AIS)数据挖掘不够充分,对航路辨识分析不够全面等问题,提出一种基于改进谱聚类算法的数据挖掘方式。利用Sliding Window算法对船舶轨迹AIS数据进行压缩,减少数据冗余提高聚类效率。改进亲和距离函数,提出新的亲和矩阵的标准,提高聚类的稳定性,进一步对数据去噪,减少噪声敏感。通过优化初始中心对k均值算法进行改进,优化全局搜索能力,缓解初始值的选取对聚类效果的影响。以天津港AIS数据为样本进行算法验证。结果表明,该聚类算法能准确提取和划分某水域船舶主要航迹段,算法消耗系统资源少,计算速度快。改进后的算法可为航路辨识、分道通航制定等提供理论支持。  相似文献   

18.
聚类是人类一项最基本的认识活动 ,通过适当的聚类 ,事物才便于研究 ,事物的内部规律才可能为人类所掌握。但是 ,由于人们不总是能对客观世界进行精确的描述 ,很多信息和数据都是不确定的、模糊的。为了处理模糊数据 ,把模糊性引入数据库系统中 ,从而形成了模糊关系数据库。本文对模糊关系数据库下的基于距离函数的聚类算法进行了研究 ,并通过例子来说明如何建立和应用这种数据挖掘模型  相似文献   

19.
文章根据聚类分析和模糊相似矩阵理论,采用基于模糊聚类的综合排序方法,提出一种基于聚类的指标综合评价模型,并通过实例应用验证了这个模型的可用性。借助该模型对多目标决策中的决策指标项进行综合评价,可为决策者提供有效的决策依据。  相似文献   

20.
数据流聚类算法分析   总被引:1,自引:0,他引:1  
首先比较了数据流聚类分析与传统的聚类分析方法的一些不同点,对目前最新的一些数据流聚类研究成果进行了分析,最后对数据流聚类发展方向进行了展望.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号