首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
提出了一种基于减法聚类的聚类上限检测方法.仿真试验表明,这种方法能将聚类上限确定在一个合理的范围之内,从而加快聚类的效率.  相似文献   

2.
利用统计分析软件SPSS对99组实例数据进行聚类分析,包括K-means聚类、系统聚类、两步聚类三大类,其中K-means聚类包括K-means未标准化聚类和K-means标准化聚类两小类,选取判断类内紧致性指标1和类间分离性指标2综合衡量聚类结果有效性,从而比较聚类数种算法中三大聚类方法的聚类效果。实验发现,K-means聚类有效性普遍比系统聚类好,系统聚类普遍比两步聚类有效,且系统聚类分析效果随着聚类个数的增加不断改善。  相似文献   

3.
主要就聚类算法研究中的一些基本问题做了深入分析,明确了在应用聚类算法、改进算法或者开发新的算法时的一些基本要求,并在最后列出了各种常用算法的特点,评价了各类算法的性能。  相似文献   

4.
针对谱系聚类的有效性,提出了一个新的聚类准则用于汶川地震灾害评估,并选用经典的Iris花蕾数据和Wine葡萄酒数据与流行的模糊C均值聚类准则比较,结果表明新准则计算简单且更符合实际情况.  相似文献   

5.
Clustering-based selective neural network ensemble   总被引:1,自引:0,他引:1  
INTRODUCTION Neural network ensemble is becoming a hot spot in machine learning and data mining recently. Many researchers have shown that simply combining the output of many neural networks can generate more accurate predictions than that of any of the individual networks. Most previous work either focused on how to combine the output of multiple trained networks or how to directly design a good set of neural networks. Theoretical and empirical work showed that a good ensemble is one wh…  相似文献   

6.
文本聚类综述   总被引:1,自引:0,他引:1  
聚类作为一种自动化程度较高的无监督机器学习方法,近年来在信息检索、多文档自动文摘、智能搜索引擎、短文本信息处理等领域获得了广泛的应用。本文首先讨论了文本聚类(Text clustering)的应用,然后对文本聚类算法、聚类关键技术进行了综述。  相似文献   

7.
通过分析目前的聚类算法,提出了多隶属聚类的概念;提出了一种基于频繁项目集的多隶属聚类算法,该算法能产生事务型数据的多隶属聚类。  相似文献   

8.
提出一种新的层次聚类方法,着重分析了该算法的思想体系及算法实现过程。该算法具有使结果簇更紧凑和独立的效果,具有更高的效率。  相似文献   

9.
为了对社会化标注系统中的标签进行有效聚类,并针对传统K-medoids算法存在的聚类结果易受初始聚类中心影响的问题,本文提出了一种改进的K-medoids标签聚类算法.该算法应用社会化标签的余弦相似值进行初始聚类中心的选择,然后进行标签聚类.对Delicious标签数据集的实验结果表明算法具有较强的的可行性和有效性.  相似文献   

10.
传统的K—means算法对初始聚类中心敏感,聚类的结果随不同的初始输入而波动.为了消除这种敏感性,提出了一种改进的K-means算法,改善聚类算法中选取初值的依赖性,提高聚类结果的稳定性.仿真实验结果表明:改进后的K-means算法优于原始算法.  相似文献   

11.
一种基于向量空间模型的文本聚类方法   总被引:3,自引:0,他引:3  
研究了一种基于向量空间模型的文档聚类方法.提出了一个新的聚类模型,即在传统聚类模型的基础上增加一个文档特征向量调整模块;给出了一个特征评价函数用以进行特征提取;对一种基于相似度的平面划分聚类算法做了一些改进.实验结果表明本文提出的聚类模型是可行的.  相似文献   

12.
谱聚类在近年来得到了广泛的应用,而将谱聚类和半监督集群结合的方法通过使用约束改善结果来提高谱聚类的有效性.文章通过选择主动学习方法,提出了一种基于主动学习的半监督谱聚类算法.首先,利用邻域中包含的信息来确定要查询的数据,由于邻域信息只反映局部信息,因此,又引入与目标不太相似的数据点,这些数据点代表全局信息,得到Must-link(正关联)成对约束集和Cannot-link(负关联)成对约束集.然后,对得到的成对约束再通过k-means聚类得到聚类结果.最后,通过在合成数据集以及UCI数据集的对比实验表明文章算法的有效性,通过较小的主动选择成对约束来获得更好的性能.  相似文献   

13.
针对Web挖掘,首先论述了Web挖掘的基本理论,接着分析数据挖掘中的聚类算法,讨论了聚类分析的数据结构和数据类型,以及聚类算法的分类,详细介绍了数据挖掘中用到的主要聚类算法,最后对评价聚类结果的方法进行了分析。  相似文献   

14.
确定一个所谓的“最优”聚类方法通常是不可能的,于是提出一种容许聚类法。本文讨论在系统聚类中的最常用方法-最小距离聚类法的容许性问题。  相似文献   

15.
利用分层聚类分析方法研究了2002年江苏高校分科教育规模和专任教师队伍大小。结果表明,相对于较多的学生培养任务,管理学的专任教师队伍需要在数量和质量上再上一个台阶。为此,中给出了管理学教师队伍建设的一些建议。  相似文献   

16.
在传统聚类模型的基础上,提出一种基于向量空间模型的层次聚类算法,用于文本数据的挖掘。实验结果表明,基于向量空间模型的层次聚类算法从挖掘的准确率上更具有性能优势。  相似文献   

17.
教师课堂教学质量评价的灰色聚类决策方法   总被引:4,自引:0,他引:4  
本文将灰色聚类决策方法应用于教师课堂教学质量评价,给出教学质量状态的灰色分类,定义灰类的白化权函数,建立评价模型,对教师教学质量评价实例进行计算,并与模糊聚类方法对比.结果表明,模糊聚类具有不确定性,教学质量状态不明确;灰色聚类评价直观可靠,可以为教学管理部门的科学决策提供依据.  相似文献   

18.
数据挖掘领域中的聚类分析及应用   总被引:1,自引:0,他引:1  
聚类是统计学的一种方法,也作为数据挖掘的一个功能被广泛地应用。本文介绍了聚类的概念、应用,主要的聚类算法。最后,针对现实中的一个具体问题,设计了一个层次型的聚类算法,其结果对相关部门具有一定的指导作用。  相似文献   

19.
聚类分析广泛应用于商务智能、图像模式识别、Web搜索、生物学等领域,是一种无指导的观察式学习。然而,绝大多数聚类分析算法都面临着一个非常棘手的问题——最佳聚类数的确定。K-means是典型的基于划分的聚类方法,它需要用户输入聚类数K,但这通常非常困难。聚类数的确定是决定聚类质量的关键因素。虽然有许多被用来估计最优聚类数的聚类评价指标,但对于不同的聚类算法,不同的评价指标效果差异很大。为确定针对K-means聚类算法效果最好的评价指标,采用4种典型的不同聚类结构特征的人工模拟数据以及来自UCI的真实数据集对7种评价指标的性能进行实验比较,结果表明CH指标和I指标在评估K-means算法的最佳聚类数时效果较好。  相似文献   

20.
一种K-means算法的k值优化方案   总被引:1,自引:0,他引:1  
聚类算法是数据挖掘中核心技术之一,而k-means算法在经典聚类算法中占有重要地位。针对k-means聚类算法的最佳聚类个数k不易获得,因而使得该聚类算法的应用受到限制,为此提出一种k值优化方法:通过给出大于最佳聚类数的可能聚类数,而得到优化的聚类个数。通过实例给予验证,其结果说明该方法合理有效。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号