首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
针对FCM(模糊C均值聚类算法)对初始聚类中心的选取敏感以及梯度法易收敛到鞍点,在此基础上提出了一种分层遗传算法(HGA)优化的核模糊C均值聚类算法(HGA-KFCM)来提升聚类性能,首先用分层遗传算法(HGA)在全局筛选出高品质聚类中心以替代FCM的随机产生的聚类中心,再利用高斯径向核函数改变FCM中的距离函数并且重...  相似文献   

2.
郭伟光  汪本强  杨学春 《情报杂志》2015,(2):159-163,158
针对社会化标签语义模糊,传统K-medoids聚类算法对初始聚类中心敏感、收敛速度缓慢、只能将归类对象划入到单一类别的缺点,提出一种基于改进K-medoids的社会化标注资源两阶段聚类算法。算法应用一种简洁快速的初始聚类中心选取新规则以及改进的聚类准则函数,首先进行标签聚类,然后将同一标签簇中标签标注的网络资源初步划分到同一资源簇中,最后在这些资源簇中再次进行资源聚类。实验结果表明,提出的算法能自主、合理地确定初始聚类中心,聚类过程收敛速度快,聚类结果有更好的准确性。  相似文献   

3.
针对变压器红外检测中存在图像清晰度不足、故障位置指示不明显的问题。本文提出将改进稳健模糊核聚类算法(IRKFCM)应用到散热器红外检测图像分割中,以提高散热器的故障诊断正确率。通过将红外设备采集到的散热器实时图像信息融入到改进的稳健模糊核聚类算法,根据图像所包含的灰度信息和空间信息对其进行进行区域分割,并引入聚类中心的初始化方法有效减少迭代次数,增强算法的稳健性。实验表明该算法相对于FCM分割算法能准确有效地分割出有故障的散热器片和位置,精度满足系统要求。  相似文献   

4.
模糊C均值(FCM)聚类算法能很好地解决不确定问题的分类,但该算法聚类结果却过于依赖初始聚类中心和易陷入局部最优解。本文重点针对基于密度函数的初始聚类中心初始化算法进行分类总结,将密度函数的度量方式归纳为4大类。通过实验对比分析了各种度量方式的优缺点,旨在为研究人员选择适合的密度函数度量方法提供一定的参考。  相似文献   

5.
基于模糊商空间的模糊C-均值算法(QFCM)是在模糊商空间和模糊模糊C-均值(FCM)的基础上提出的。通过引入相似函数并构造出归一化距离,得到模糊商空间的分层递阶的结构,在此基础上提出了基于粒度思想的准则函数并选择出一个最佳层次,从而确定聚类的个数,并选择具有相似度高的样本作为初始聚类中心,结合鲁棒性统计观点运用归一化距离来替代FCM目标函数中的欧式距离度量,提出了QFCM算法。实验证明与传统的算法比较,QFCM算法能够自动确定最佳聚类数目,发现大小不均的聚类,迭代次数少,有效地消除了传统FCM算法对初始值敏感,提高了算法的稳定性和准确率。  相似文献   

6.
针对经典K-means聚类算法过于依赖初始聚类中心和易陷入局部最优的不足,提出一种带有学习能力的人工蜂群算法(ABC)与K-means迭代相结合的聚类算法。该算法通过能动态调节的学习权重因子来平衡人工蜂群算法的全局探测与局部搜索能力,同时结合K-means聚类快速的优点,来提高聚类算法的全局寻优能力,降低初始聚类中心对算法聚类质量的影响。通过仿真试验验证,该算法克服了K-means算法的缺点,具有收敛速度快、稳定性强和聚类精度高的优势,得到良好的聚类效果。  相似文献   

7.
对海量数据信息进行迭代聚类能够为数据挖掘提供准确的依据,具有重要的应用价值。传统算法对于初始参数的选取过于敏感,从而降低了迭代聚类的准确率。提出基于并归聚类的海量数据信息中的迭代聚类方法。采用离差隶属度进行数据信息聚类中心的计算,确定数据信息的聚类中心;采用类间距离作为并归聚类判别的标准,用于判定数据信息特征与聚类中心的距离;对海量数据信息特征与聚类中心的计算结果进行归类处理,直至所有的数据信息的聚类中心都结束并归,从而获得准确的迭代聚类结果。仿真实验结果表明,改进算法能够提高海量数据信息中的迭代聚类结果,效果令人满意。  相似文献   

8.
针对K-Means算法中对初始聚类中心进行随机选择并未达到理想优化的情况,提出一种改进的初始聚类中心选择算法。改进算法首先将原始数据进行预处理并计算各维有效数据的最大值和最小值,然后利用各维有效数据的最大值和最小值进行数据分段和初始聚类中心选择,最后采用VS集成开发环境进行建模。采用遵义医学院2010级的学生计算机考试成绩数据对模型进行仿真,仿真结果显示聚类挖掘性能相对K-Means算法较高,证明改进的初始聚类中心选择算法可以提供精确的聚类挖掘结果。  相似文献   

9.
李雷 《科技风》2013,(6):120
针对FCM算法主要应用于点数据聚类,不能直接处理关系型数据的缺点。本文提出了一种基于Web日志的数据挖掘聚类算法,首先对FCM算法进行改进使其能够处理关系型数据,并对算法进行了健壮性改进。然后针对传统FCM算法需要在没有先验知识的基础上,事先确定聚类类别数的缺点,引入了竞争凝聚算法(CA),与FCM算法相结合,形成了CA-FCM算法,使之能够自动确定最佳分类类别数。实验表明,CA-FCM算法的挖掘结果与FCM算法的结果相近,在用户访问会话数量不太大时性能优于FCM算法。  相似文献   

10.
姜灵敏 《科技管理研究》2005,25(11):217-219
爬山法一般得不到全局最优分类,k-均值法等常规动态聚类方法对初始聚类中心的选择非常敏感且聚类结果依赖样本的输入次序,结合遗传算法的全局搜索能力和爬山算法的局部搜索能力改进常规动态聚类方法,可以有效地解决这些问题,通常可保证能在有限的迭代次数内搜索到全局最优解。  相似文献   

11.
聂珍  王华秋 《现代情报》2012,32(7):112-116,121
本文采取了3种必要的措施提高了聚类质量:考虑到各维数据特征属性对聚类效果影响不同,采用了基于统计方法的维度加权的方法进行特征选择;对于和声搜索算法的调音概率进行了改进,将改进的和声搜索算法和模糊聚类相结合用于快速寻找最优的聚类中心;循环测试各种中心数情况下的聚类质量以获得最佳的类中心数。接着,该算法被应用于图书馆读者兴趣度建模中,用于识别图书馆日常运行时各读者借阅图书的类型,实验表明该算法较其它算法更优。这样的读者兴趣度聚类分析可以进行图书推荐,从而提高图书馆的运行效率。  相似文献   

12.
张建华  冉佳  刘柯 《科技管理研究》2020,40(19):140-146
针对传统知识推荐算法存在的语义缺失和精准性低问题,本文提出一种基于改进LDA-FCM的知识推荐算法。首先获取用户知识文档,采用主题优化的LDA模型挖掘用户知识主题。继而通过FCM算法将用户聚类,缩小相似度计算的遍历范围,并采用JS散度代替欧氏距离,实现FCM对象到用户的转换。最后基于UserCF算法构建用户对知识的兴趣指数并进行TOP-N推荐。爬取中国知网500篇期刊论文实测发现:与传统UserCF算法相比,改进算法的准确率、召回率和F1值分别提高了28.17%、59.62%、53.88%。  相似文献   

13.
将Web网站用户浏览日志进行访问用户的有效性提取,并利用相异度原理对提取的Web访问用户进行聚类中心和聚类数的确定,并以此做为SOM神经网络权值的调节值和SOM神经网络输出的节点数,从而优化SOM神经网络的学习能力,提高SOM神经网络的聚类效果。  相似文献   

14.
Due to the hopeful application of gathering information from unreachable position, wireless sensor network creates an immense challenge for data routing to maximize the communication with more energy efficiency. In order to design the energy efficient routing, the optimization based clustering protocols are more preferred in wireless sensor network. In this paper, we have proposed competent optimization based algorithm called Fractional lion (FLION) clustering algorithm for creating the energy efficient routing path. Here, the proposed clustering algorithm is used to increase the energy and lifetime of the network nodes by selecting the rapid cluster head. In addition, we have proposed multi-objective FLION clustering algorithm to develop the new fitness function based on the five objectives like intra-cluster distance, inter-cluster distance, cluster head energy, normal nodes energy and delay. Here, the proposed fitness function is used to find the rapid cluster centroid for an efficient routing path. Finally, the performance of the proposed clustering algorithm is compared with the existing clustering algorithms such as low energy adaptive clustering hierarchy (LEACH), particle swarm optimization (PSO), artificial bee colony (ABC) and Fractional ABC clustering algorithm. The results proved that the lifetime of the wireless sensor nodes is maximized by the proposed FLION based multi-objective clustering algorithm as compared with existing protocols.  相似文献   

15.
This paper presents a cluster validation based document clustering algorithm, which is capable of identifying an important feature subset and the intrinsic value of model order (cluster number). The important feature subset is selected by optimizing a cluster validity criterion subject to some constraint. For achieving model order identification capability, this feature selection procedure is conducted for each possible value of cluster number. The feature subset and the cluster number which maximize the cluster validity criterion are chosen as our answer. We have evaluated our algorithm using several datasets from the 20Newsgroup corpus. Experimental results show that our algorithm can find the important feature subset, estimate the cluster number and achieve higher micro-averaged precision than previous document clustering algorithms which require the value of cluster number to be provided.  相似文献   

16.
针对k-均值聚类方法可能受初始选定的聚类中心的影响而过早收敛于次优解的不足,给出了一种基于自适应遗传算法的聚类分析方法(AGAC)。对该自适应遗传算法的构成要素及用其解决聚类问题的一般步骤给出了阐述。用VS 2008编写了该算法的程序用来对数字进行聚类取得了较好的聚类结果。  相似文献   

17.
Typically graph-clustering approaches assume that a cluster is a vertex subset such that for all of its vertices, the number of links connecting a vertex to its cluster is higher than the number of links connecting the vertex to the remaining graph. We consider a cluster such that for all of its vertices, the number of links connecting a vertex to its cluster is higher than the number of links connecting the vertex to any other cluster. Based on this fundamental view, we propose a graph-clustering algorithm that identifies clusters even if they contain vertices more strongly connected outside than inside their cluster; hence, the proposed algorithm is proved exceptionally efficient in clustering densely interconnected graphs. Extensive experimentation with artificial and real datasets shows that our approach outperforms earlier alternate clustering techniques.  相似文献   

18.
基于改进特征提取及聚类的网络评论挖掘研究   总被引:1,自引:0,他引:1  
[目的/意义]针对信息过载条件下中文网络产品评论中特征提取性能低以及特征聚类中初始中心点的选取问题。[方法/过程]本研究提出采用基于权重的改进Apriori算法产生候选产品特征集合,再根据独立支持度、频繁项名词非特征规则及基于网络搜索引擎的PMI算法对候选产品特征集合进行过滤。并以基于HowNet的语义相似度和特征观点共现作为衡量产品特征之间关联程度的特征,提出一种改进K-means聚类算法对产品特征进行聚类。[结果/结论]实验结果表明,在特征提取阶段,查准率为69%,查全率为92.64%,综合值达到79.07%。在特征聚类阶段,本文提出的改进K-means算法相对传统算法具有更优的挖掘性能。  相似文献   

19.
介绍聚类算法的过程以及聚类有效性指标的分类,分别评述科学计量学常用软件中的几种聚类算法,分析聚类算法的特性并采用基于类内紧密度和类间分离度对聚类结果的有效性进行探讨,总结各聚类算法的效果并对应软件分析的结果进行案例分析。  相似文献   

20.
提出了一种基于迭代自适应机制的改进算法,有效地缩减了分层置信传播算法(HBP)的计算时间.传统HBP计算时间随指定的迭代上限增加而线性增长.为此引入消息收敛的条件判断,在迭代上限相同情况下,减少算法的迭代次数,缩减整体迭代时间.实验表明,与传统HBP相比,该方法计算时间缩减了38%以上,计算时间对整体迭代上限不敏感.该方法可以应用于使用HBP算法的其他方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号