共查询到20条相似文献,搜索用时 171 毫秒
1.
2.
针对社会化标签语义模糊,传统K-medoids聚类算法对初始聚类中心敏感、收敛速度缓慢、只能将归类对象划入到单一类别的缺点,提出一种基于改进K-medoids的社会化标注资源两阶段聚类算法。算法应用一种简洁快速的初始聚类中心选取新规则以及改进的聚类准则函数,首先进行标签聚类,然后将同一标签簇中标签标注的网络资源初步划分到同一资源簇中,最后在这些资源簇中再次进行资源聚类。实验结果表明,提出的算法能自主、合理地确定初始聚类中心,聚类过程收敛速度快,聚类结果有更好的准确性。 相似文献
3.
针对变压器红外检测中存在图像清晰度不足、故障位置指示不明显的问题。本文提出将改进稳健模糊核聚类算法(IRKFCM)应用到散热器红外检测图像分割中,以提高散热器的故障诊断正确率。通过将红外设备采集到的散热器实时图像信息融入到改进的稳健模糊核聚类算法,根据图像所包含的灰度信息和空间信息对其进行进行区域分割,并引入聚类中心的初始化方法有效减少迭代次数,增强算法的稳健性。实验表明该算法相对于FCM分割算法能准确有效地分割出有故障的散热器片和位置,精度满足系统要求。 相似文献
4.
5.
基于模糊商空间的模糊C-均值算法(QFCM)是在模糊商空间和模糊模糊C-均值(FCM)的基础上提出的。通过引入相似函数并构造出归一化距离,得到模糊商空间的分层递阶的结构,在此基础上提出了基于粒度思想的准则函数并选择出一个最佳层次,从而确定聚类的个数,并选择具有相似度高的样本作为初始聚类中心,结合鲁棒性统计观点运用归一化距离来替代FCM目标函数中的欧式距离度量,提出了QFCM算法。实验证明与传统的算法比较,QFCM算法能够自动确定最佳聚类数目,发现大小不均的聚类,迭代次数少,有效地消除了传统FCM算法对初始值敏感,提高了算法的稳定性和准确率。 相似文献
6.
7.
8.
针对K-Means算法中对初始聚类中心进行随机选择并未达到理想优化的情况,提出一种改进的初始聚类中心选择算法。改进算法首先将原始数据进行预处理并计算各维有效数据的最大值和最小值,然后利用各维有效数据的最大值和最小值进行数据分段和初始聚类中心选择,最后采用VS集成开发环境进行建模。采用遵义医学院2010级的学生计算机考试成绩数据对模型进行仿真,仿真结果显示聚类挖掘性能相对K-Means算法较高,证明改进的初始聚类中心选择算法可以提供精确的聚类挖掘结果。 相似文献
9.
针对FCM算法主要应用于点数据聚类,不能直接处理关系型数据的缺点。本文提出了一种基于Web日志的数据挖掘聚类算法,首先对FCM算法进行改进使其能够处理关系型数据,并对算法进行了健壮性改进。然后针对传统FCM算法需要在没有先验知识的基础上,事先确定聚类类别数的缺点,引入了竞争凝聚算法(CA),与FCM算法相结合,形成了CA-FCM算法,使之能够自动确定最佳分类类别数。实验表明,CA-FCM算法的挖掘结果与FCM算法的结果相近,在用户访问会话数量不太大时性能优于FCM算法。 相似文献
10.
爬山法一般得不到全局最优分类,k-均值法等常规动态聚类方法对初始聚类中心的选择非常敏感且聚类结果依赖样本的输入次序,结合遗传算法的全局搜索能力和爬山算法的局部搜索能力改进常规动态聚类方法,可以有效地解决这些问题,通常可保证能在有限的迭代次数内搜索到全局最优解。 相似文献
11.
本文采取了3种必要的措施提高了聚类质量:考虑到各维数据特征属性对聚类效果影响不同,采用了基于统计方法的维度加权的方法进行特征选择;对于和声搜索算法的调音概率进行了改进,将改进的和声搜索算法和模糊聚类相结合用于快速寻找最优的聚类中心;循环测试各种中心数情况下的聚类质量以获得最佳的类中心数。接着,该算法被应用于图书馆读者兴趣度建模中,用于识别图书馆日常运行时各读者借阅图书的类型,实验表明该算法较其它算法更优。这样的读者兴趣度聚类分析可以进行图书推荐,从而提高图书馆的运行效率。 相似文献
12.
针对传统知识推荐算法存在的语义缺失和精准性低问题,本文提出一种基于改进LDA-FCM的知识推荐算法。首先获取用户知识文档,采用主题优化的LDA模型挖掘用户知识主题。继而通过FCM算法将用户聚类,缩小相似度计算的遍历范围,并采用JS散度代替欧氏距离,实现FCM对象到用户的转换。最后基于UserCF算法构建用户对知识的兴趣指数并进行TOP-N推荐。爬取中国知网500篇期刊论文实测发现:与传统UserCF算法相比,改进算法的准确率、召回率和F1值分别提高了28.17%、59.62%、53.88%。 相似文献
13.
14.
《Journal of The Franklin Institute》2017,354(11):4457-4480
Due to the hopeful application of gathering information from unreachable position, wireless sensor network creates an immense challenge for data routing to maximize the communication with more energy efficiency. In order to design the energy efficient routing, the optimization based clustering protocols are more preferred in wireless sensor network. In this paper, we have proposed competent optimization based algorithm called Fractional lion (FLION) clustering algorithm for creating the energy efficient routing path. Here, the proposed clustering algorithm is used to increase the energy and lifetime of the network nodes by selecting the rapid cluster head. In addition, we have proposed multi-objective FLION clustering algorithm to develop the new fitness function based on the five objectives like intra-cluster distance, inter-cluster distance, cluster head energy, normal nodes energy and delay. Here, the proposed fitness function is used to find the rapid cluster centroid for an efficient routing path. Finally, the performance of the proposed clustering algorithm is compared with the existing clustering algorithms such as low energy adaptive clustering hierarchy (LEACH), particle swarm optimization (PSO), artificial bee colony (ABC) and Fractional ABC clustering algorithm. The results proved that the lifetime of the wireless sensor nodes is maximized by the proposed FLION based multi-objective clustering algorithm as compared with existing protocols. 相似文献
15.
This paper presents a cluster validation based document clustering algorithm, which is capable of identifying an important feature subset and the intrinsic value of model order (cluster number). The important feature subset is selected by optimizing a cluster validity criterion subject to some constraint. For achieving model order identification capability, this feature selection procedure is conducted for each possible value of cluster number. The feature subset and the cluster number which maximize the cluster validity criterion are chosen as our answer. We have evaluated our algorithm using several datasets from the 20Newsgroup corpus. Experimental results show that our algorithm can find the important feature subset, estimate the cluster number and achieve higher micro-averaged precision than previous document clustering algorithms which require the value of cluster number to be provided. 相似文献
16.
针对k-均值聚类方法可能受初始选定的聚类中心的影响而过早收敛于次优解的不足,给出了一种基于自适应遗传算法的聚类分析方法(AGAC)。对该自适应遗传算法的构成要素及用其解决聚类问题的一般步骤给出了阐述。用VS 2008编写了该算法的程序用来对数字进行聚类取得了较好的聚类结果。 相似文献
17.
Typically graph-clustering approaches assume that a cluster is a vertex subset such that for all of its vertices, the number of links connecting a vertex to its cluster is higher than the number of links connecting the vertex to the remaining graph. We consider a cluster such that for all of its vertices, the number of links connecting a vertex to its cluster is higher than the number of links connecting the vertex to any other cluster. Based on this fundamental view, we propose a graph-clustering algorithm that identifies clusters even if they contain vertices more strongly connected outside than inside their cluster; hence, the proposed algorithm is proved exceptionally efficient in clustering densely interconnected graphs. Extensive experimentation with artificial and real datasets shows that our approach outperforms earlier alternate clustering techniques. 相似文献
18.
基于改进特征提取及聚类的网络评论挖掘研究 总被引:1,自引:0,他引:1
[目的/意义]针对信息过载条件下中文网络产品评论中特征提取性能低以及特征聚类中初始中心点的选取问题。[方法/过程]本研究提出采用基于权重的改进Apriori算法产生候选产品特征集合,再根据独立支持度、频繁项名词非特征规则及基于网络搜索引擎的PMI算法对候选产品特征集合进行过滤。并以基于HowNet的语义相似度和特征观点共现作为衡量产品特征之间关联程度的特征,提出一种改进K-means聚类算法对产品特征进行聚类。[结果/结论]实验结果表明,在特征提取阶段,查准率为69%,查全率为92.64%,综合值达到79.07%。在特征聚类阶段,本文提出的改进K-means算法相对传统算法具有更优的挖掘性能。 相似文献
19.
20.
提出了一种基于迭代自适应机制的改进算法,有效地缩减了分层置信传播算法(HBP)的计算时间.传统HBP计算时间随指定的迭代上限增加而线性增长.为此引入消息收敛的条件判断,在迭代上限相同情况下,减少算法的迭代次数,缩减整体迭代时间.实验表明,与传统HBP相比,该方法计算时间缩减了38%以上,计算时间对整体迭代上限不敏感.该方法可以应用于使用HBP算法的其他方法. 相似文献