首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
介绍和比较了现有的空间聚类算法,并改进了基于密度的DBSCAN算法,该算法大大减少了I/O开销,更适合高维空间数据库的数据聚类。  相似文献   

2.
提出一种将改进的核函数应用于土壤肥力研究的聚类方法。该方法在K-means聚类算法的基础上加入核函数,简化目标函数,将数据从低维空间映射到高维空间增加样本特征差异,同时提出相应选取参数的标准,提高聚类效果。实验表明,该算法对于非凸型数据或多维数据聚类正确率较高,具有良好的性能,能较好地反映土壤肥力指标和土壤利用的关系,可使土壤肥力的发展与作物的需求达到协调一致的状态,保障农作物的高产稳产。  相似文献   

3.
阐述了在远程教育的研究和应用中,利用基于关联规则的多层次、超图分割聚类方法,对Web网页和用户进行有效聚类。该方法借助网站层次图,可以根据实际需要,在各个层次上进行聚类分析,仅将高度相关的网页和用户聚在同一类,而将关联性较小的网页排除在聚类外。  相似文献   

4.
阐述了在远程教育的研究和应用中,利用基于关联规则的多层次、超图分割聚类方法,对Web网页和用户进行有效聚类。该方法借助网站层次图,可以根据实际需要,在各个层次上进行聚类分析,仅将高度相关的网页和用户聚在同一类,而将关联性较小的网页排除在聚类外。  相似文献   

5.
针对采用主成分分析法进行多光谱数据降维会使重构光谱反射比出现负值的问题, 提出一种非负约束主成分分析法, 并用该法构造低维空间, 实现高维多光谱数据向低维空间的转换. 首先分析主成分分析法产生非光谱数据的原因, 据此对经典主成分分析模型增加非负约束; 然后求出一组线性无关的非负主成分权向量, 用该组向量构造低维空间; 最后用非线性优化技术确定高维数据在该低维空间中的投影值, 实现了高维空间与低维空间的相互转换. 实验结果表明, 新方法能使重构光谱数据在[0, 1]内, 保持了光谱反射比的物理意义, 同时所构造低维空间的精度能与经典主成分分析法保持一致.  相似文献   

6.
应用非线性映射模型制作洪水预测   总被引:1,自引:0,他引:1  
在最小误差的意义下,进行从高维空间到低维空间的一个映射,任一个高维向量通过这个转换,只需少数坐标(如2个坐标)就可以确定它的图象.应用这个原理,可将多个预报因子的信息压宿为少数因子的信息,然后利用点聚图直观地制作洪水预报。  相似文献   

7.
K-means算法在聚类过程中随机选取k个初始聚类中心,容易造成聚类结果不稳定。针对该问题,提出PCA-TDKM算法:使用主成分分析法对数据对象集合的属性进行降维,提取出主属性,去掉无关属性,从而加速聚类过程;基于最小生成树算法及树的剪枝方法将数据对象划分为k个初始聚类簇,然后进行剪枝生成k棵子树,计算每棵子树中所有数据对象的均值,作为初始聚类中心;利用基于密度与最大最小距离的算法思想进行聚类。将PCA-TDKM算法与K-means、KNE-KM、QMC KM、CFSFDP-KM在UCI数据集上进行聚类比较,结果表明该算法聚类结果稳定、聚类准确率高。  相似文献   

8.
为了解决数据高维、海量导致聚类算法处理效果不佳的问题,提出将流形学习理论引入客户关系管理进行聚类研究。为了较好的分析客户价值,在Kmeans聚类的基础上引入流形学习理论。客户价值分析一般包含数据的抽取、探索以及预处理、模型建立几个步骤。在模型建立过程中一般采用Kmeans聚类实现。使用流形学习的谱聚类来替代Kmeans聚类。使用泰迪杯数据挖掘大赛中的数据进行试验,通过实验的雷达图可以看出,谱聚类与Kmeans聚类具有相似的分类构成。同时对于分类后的数据进行规约并绘制散点图,比较后发现,谱聚类后的数据类间相似度比Kmeans高,表明将流形学习方法引入客户价值分析,对于聚类稳定性有一定改善。  相似文献   

9.
万有引力定律在聚类中的应用   总被引:2,自引:0,他引:2  
聚类是数据挖掘中的一个非常活跃的研究领域,聚类的目的就是把数据集分成不同的类,类内相似度高,类间相异度大。本文介绍了在聚类过程中经常遇到的数据结构、变量类型和聚类方法,提出了基于万有引力定律的聚类方法,使聚类的速度和效果有了进一步的提高。  相似文献   

10.
针对Kmeans算法对海量数据聚类效率过低的不足,基于Hadoop的分布式架构思想,提出一种多核果蝇-Kmeans聚类算法(MKFOA-Kmeans)。以每次迭代后果蝇位置为聚类中心进行一次Kmeans聚类算法,综合了果蝇优化算法强全局搜索能力以及Kmeans算法强局部搜索能力的优点。MapReduce框架简化了算法执行过程,避免了由于存储空间不足而造成的算法失效。在由普通硬件搭建的Hadoop平台下进行仿真实验,表明MKFOA-Kmeans算法对大数据的聚类准确率高,并且随着数据量的增加,聚类效率优势也愈加明显。  相似文献   

11.
基于层次的模糊K均值聚类算法研究   总被引:1,自引:0,他引:1  
通过对K均值聚类算法的研究,本文提出了一种基于层次聚类与模糊聚类思想的K均值聚类算法。算法首先使用层次方法对数据进行初始聚类,然后用得到的聚类数作为模糊K均值聚类中的K值,对聚类进行修正。最后通过实验,验证了该算法不需要人为假设聚类算法中的K值,而且引入了模糊隶属关系使类别的划分更接近于事实,从而证明了该算法的有效性。  相似文献   

12.
由于FCM算法中的初始值需要随机的设定,这种随机性不能保证每次都能达到全局最优,也就是说如果初始聚类中心的设置具有全局的特点,那么聚类的结果才能达到全局最优。因此主要针对模糊c-均值(FCM)聚类算法对初始值很敏感,而且容易陷入局部最优解的这一特点,提出了一种分布式的模糊聚类方法。首先用分治法得到模糊聚类的全局的聚类中心值,然后再用FCM进行聚类,从而克服FCM算法对初始值敏感和容易陷入局部最优解的缺陷,达到全局最优。经仿真实验证明结果是很理想的。  相似文献   

13.
Web文本挖掘是数据挖掘技术在网络信息处理中的一个重要应用,如何将web文档转换成数据挖掘所要求的格式,即web文档预处理是一项很重要的研究课题.本文的方法是:从Internet网上下载了大量的网页文件,将网页文件转换成文本文件,然后通过算法对这些文本文件中的数据进行词频统计,删除非用词,去掉高频词,对单词进行词根处理,建立用词词表,从而抽取用词,按字母排序生成词频索引,和字典文件进行对照,获取单词的ID,最后生成Reuters-21578的Database数据格式.这样就将web文档数据转换成标准的数据集,以便为数据挖掘中分类、聚类作好准备.  相似文献   

14.
针对数据流的特点,提出了一种新的网格密度结合的GCTS算法.它采用了双层架构,在线层实现了网格密度参数的自设定,离线层以网格单元的重心为中心点,建立一个最大的子网格,使候选网格中的局部密集区域转化成了密集网格.最后使用最小生成树的算法生成进行聚类结果.提高了聚类效果.  相似文献   

15.
针对葡萄酒的质量,通过有关数据分析,运用Matlab中主成分分析方法提取主要影响指标,在此基础上,运用模糊C均值聚类方法得到酿酒葡萄和葡萄酒的理化指标,并在一定程度上反映了它们的质量。运用相关系数分析和典型相关分析方法,得到酿酒葡萄和葡萄酒的各项理化、感官指标及质量问题间的关系。  相似文献   

16.
把定义在一个圈上的超图的每个超边映射为这个圈的一条路,每条超边的顶点均在对应的映射中,要求使圈中的任一边经过的路的最大次数最小,称此问题为超图在圈中的最小嵌入问题.将此问题归结为最近串选取问题,从而证明该问题存在多项式时间近似算法.  相似文献   

17.
Automated collaborative filtering has become a popular technique for reducing information overload. We have developed a new method for recommending items using multiple agents. The agents were established by employing the fuzzy C-means clustering technique. We employ these agents collaborating each other to get recommendation for users. The results were evaluated by using MovieLens movie's rating data. It is shown that the algorithm is an effective metrics in collaborative filtering.  相似文献   

18.
在Web日志挖掘的基础上,构建挖掘系统模型,采用模糊聚类方法对采集的日志数据进行聚类,得到用户的访问模式,从而指导校园网网站管理人员改善Web站点结构,提高用户查找信息的准确率和效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号