首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
模糊聚类问题由于其非凸性而成为一个难以解决的数学问题。在解决模糊聚类问题时,会出现很多局部极小值和鞍点。因此,启发式的模糊C-均值算法是应用最为广泛的算法,其缺点是很容易陷入局部极小值。本文提出了一种搜索模糊聚类全局最优解的Tabu搜索算法,并比较这种新算法和模糊C-均值算法的性能。经过多次数据试验,证明Tabu搜索算法在搜索全局最优解时是很有效的。  相似文献   

2.
基于模糊商空间的模糊C-均值算法(QFCM)是在模糊商空间和模糊模糊C-均值(FCM)的基础上提出的。通过引入相似函数并构造出归一化距离,得到模糊商空间的分层递阶的结构,在此基础上提出了基于粒度思想的准则函数并选择出一个最佳层次,从而确定聚类的个数,并选择具有相似度高的样本作为初始聚类中心,结合鲁棒性统计观点运用归一化距离来替代FCM目标函数中的欧式距离度量,提出了QFCM算法。实验证明与传统的算法比较,QFCM算法能够自动确定最佳聚类数目,发现大小不均的聚类,迭代次数少,有效地消除了传统FCM算法对初始值敏感,提高了算法的稳定性和准确率。  相似文献   

3.
针对K均值算法在聚类分析中还存在对初始值异常的敏感、容易陷入局部最优等问题,本文提出了一种基于相似度计算优化和指标加权优化的改进算法,首先采用欧式距离度量方式对传统K均值算法中的相似度计算进行优化,避免其进入局部最优,然后根据实际问题对聚类的指标进行加权优化。实例仿真试验结果表明,本文提出的基于相似度计算优化和指标加权优化的改进K均值算法在烟草零售终端数据聚类分析中效果良好,有利于提高货源投放的精准化。  相似文献   

4.
任燕 《科技通报》2012,28(4):206-208
主要研究了均值聚类图像分割问题。针对传统的聚类图像分割算法对图像地分割精度较低等问题,提出一种基于模糊控制的C-均值聚类快速图像分割新方法。本文采用快速模糊C-均值聚类算法对图像分割。实验结果表明,图像分割边缘清晰,分割效果明显优于传统的聚类图像分割算法。  相似文献   

5.
文章提出了一个基于模糊聚类和免疫算法的入侵检测系统.该系统引入了模糊C-均值聚类算法,对待检数据进行预处理,减少了需检测的数据量,改进了检测方法,提高了系统的检测效率和检测能力.  相似文献   

6.
研究高效进行数据聚类,提高数据聚类能力的问题。传统的模糊C均值算法具有对初始值和噪声极为敏感和遗传算法在局部极值点收敛的缺陷。基于模糊c均值聚类算法,提出一种改进的优化聚类算法。利用混沌序列的均匀遍历特性和差分进化算法的高效全局搜索能力,对模糊c均值算法进行改进,利用Logistics混沌映射对聚类算法进行优化搜索,把混沌扰动量引入到进化种群当中,弥补了模糊C均值算法的缺陷。采用改进的Logistics映射扰动搜索聚类算法,以目标识别为案例,综合4类目标特征参数为研究对象,开发了一套有价值的目标识别专家系统软件。仿真实验表明,改进的数据聚类算法,具有优越的数据聚类性能,聚类判断准确率提高明显,设计的专家系统软件对目标识别特征分类具有较好的准确性和可靠性,具有一定的应用价值。  相似文献   

7.
杨志浩  刘基 《科技广场》2010,(1):211-214
模糊C-均值聚类方法研究人类活动影响下大亚湾海域水体生态环境空间分布规律,揭示大亚湾水体生态环境空间分布分成两类区域:其一为受人类活动影响为主的大鹏澳、澳头以及大亚湾东北部区域;其二为受湾外南海海水交换影响较大的大亚湾南部、中部和东部海域。模糊C-均值聚类分析作为一种数据信息提取方法,为海洋环境生态研究提供新的方法。  相似文献   

8.
本文将数据挖掘算法应用干智能答疑系统中,提出了一套基于数据挖掘算法的答疑设计方案并加以改进,传统的K-均值算法聚类虽然速度快,在文本聚类中易于实现,但其同样依赖于所有变量,聚类效果往往不尽如人意.为了克服这一缺点,提出一种改进的K-均值文本聚类算法.它在K-均值聚类过程中,向每一个聚类簇中的关键词自动计算添加一个权重,重要的关键词赋予较大的权重.经过实验测试.获得了一种基于子空闻变量自动加权的适合文本数据聚类分析的改进算法,它不仅可以在大规模、高维和稀疏的文本数据上有效地进行聚类.还能够生成质量较高的聚类结果.实验结果表明基于子空闻变量自动加权的K-均值文本聚类算法是有效的大规模文本数据聚类算法.  相似文献   

9.
本文提出了一种免疫克隆选择算法与模糊C-均值聚类算法相结合的混合聚类算法。首先用克隆选择算法对模糊聚类中心的个数和聚类中心的选取进行指导,然后进行聚类,是一种有监督学习和无监督学习结合的一种算法,将该算法用于汽轮机的故障诊断中,诊断结果表明,该方法能够正确地诊断出存在的故障,具有实用价值。  相似文献   

10.
基于社会演化算法的聚类新算法   总被引:1,自引:0,他引:1  
郝占刚  王正欧 《情报杂志》2006,25(5):5-6,10
K均值聚类算法通常只能以局部最优结束,很难找到全局最优。提出了一种基于社会演化算法和K均值算法相结合的聚类新算法。在该算法中提出了认知主体在聚类中对范式学习的新的方式。实验证明该算法能大大提高聚类的效率和精度。  相似文献   

11.
对海量数据信息进行迭代聚类能够为数据挖掘提供准确的依据,具有重要的应用价值。传统算法对于初始参数的选取过于敏感,从而降低了迭代聚类的准确率。提出基于并归聚类的海量数据信息中的迭代聚类方法。采用离差隶属度进行数据信息聚类中心的计算,确定数据信息的聚类中心;采用类间距离作为并归聚类判别的标准,用于判定数据信息特征与聚类中心的距离;对海量数据信息特征与聚类中心的计算结果进行归类处理,直至所有的数据信息的聚类中心都结束并归,从而获得准确的迭代聚类结果。仿真实验结果表明,改进算法能够提高海量数据信息中的迭代聚类结果,效果令人满意。  相似文献   

12.
金应渊 《情报杂志》2004,23(3):43-44
针对知识发现中的模糊信息查询问题 ,提出了一种基于知识挖掘中神经网络技术的模糊信息聚类及联想设计方法。首先按照分类对信息源进行量化编码 ,然后对编码后的数据进行规整处理。对于信息聚类采用均值聚类算法 ,而模糊信息联想采用Hopfield网络实现。将基于上述算法开发出的模糊信息查询系统应用于图书信息查询 ,实验结果证明了该方法的有效性。  相似文献   

13.
首先对绿色经济评价指标进行海选,随后采用"初步筛选+R聚类-灰关联优势分析+理性分析"相结合的方法筛选评价指标,构建绿色经济发展的评价指标体系,并通过对比分析阐明该指标体系及其指标定量筛选方法的优势性:一是从评价指标信息相关性角度出发,采用Ward最小方差法依准则层对绿色经济指标进行R聚类,保证聚类后不同类间指标信息相关性较小而同类指标间相关性较大,确保筛选后的指标体系信息重复性小;二是从评价指标重要性角度出发,在R聚类的基础上提出采用灰关联优势分析,在每一类评价指标中保留对绿色经济评价结果影响最重要的指标。  相似文献   

14.
C-均值算法是一种普遍使用的聚类实现方法,在此基础上,针对时序数据的特点,使用统计理论对其进行改进,使改进后算法可以自动进行模式分类;并且,可以在可能的生产模式中,发现近似最优解,从而达到减少模式分类次数,提高效率的效果。通过选择数据测试,达到了较好的效果。  相似文献   

15.
利用三维激光扫描技术对文物进行数字化保护是当下热点,后期对文物特征重建与识别是很重要的工作。文章先直接使用传统欧式聚类无法有效提取复杂建筑体中主体有效信息,在此基础上,提出通过统计滤波首先将距离主体墙面较远的建筑剔除,让主体更加突出,再设定不同的阈值,计算点云之间的欧氏距离,将距离小于设定阈值划为一类,实现欧式聚类分割。实验表明,此方法对于故宫偏殿立面信息提取效果显著,提取过程通过编程集中于平台中实现,不再手动分割,实现自动化操作,减少文物工作者的提取繁琐流程。  相似文献   

16.
C-均值算法是一种普遍使用的聚类实现方法,在此基础上,针对时序数据的特点,使用统计理论对其进行改进,使改进后算法可以自动进行模式分类;并且,可以在可能的生产模式中,发现近似最优解,从而达到减少模式分类次数,提高效率的效果。通过选择数据测试,达到了较好的效果。  相似文献   

17.
传统的二分K均值算法在二分过程中采用随机选择的方式选择聚类质心,为了选择到理想的质心,需要重复选择多次,这种方式的时间代价比较大。为此,本文提出采用极大距离点作为质心的方式,有效的降低了时间复杂度,同时运用点抽样的方法避免离群点带来的影响。同时,考虑到随着时代的发展,我们面临的数据量会越来越大,本文提出了一种基于Hadoop分布式平台的并行二分K均值算法,实验表明,该并行算法能够获得较为理想的加速比。  相似文献   

18.
通过模糊聚类方法可以对软件需求进行类别划分;通过灰色关联方法,可以对每个类别内的需求进行重要程度排序.这种分析方法可以为需求管理提供一个科学的解决途径.  相似文献   

19.
杨选辉  蔡志强 《情报科学》2018,36(11):164-168
【目的/意义】关联数据为当前国内外关注的热点话题之一,本文对其新兴趋势进行探索,以期为关联数据 的进一步深入研究指明方向。【方法/过程】文章以CNKI中2006-2017年国内关联数据研究的700多篇文献为基础 数据,采用突变检测并结合共词分析方法,从突变权重排序、突变词主题时区视图和突变共词聚类知识图谱等不同 角度分析关联数据领域研究热点及其新兴趋势演化轨迹。【结果/结论】结果表明,国内关联数据研究文献的突变词 类型共有4种,并得出关联数据研究的两大新兴主题,以及关联数据从诞生到发布、互联和应用的一个生命周期的 四大研究热点主题。  相似文献   

20.
针对传统的微博聚类分析中,只单独针对微博阅读数、评论数等数据(下称微博结构化数据)进行分类或者单独针对由微博内容进行文本分词得到的分词数据(下称微博分词)进行分类的问题,本文采用了Kohonen聚类,研究结合微博结构化数据和微博分词的融合数据聚类的效果是否比单独对微博结构化数据或对微博分词聚类有所提高。实证数据实验结果显示,微博结构化数据单独聚类会出现一个类的标准差特别大(本文称为离群类),而对融合数据聚类,微博结构化数据则不会出现离群类;融合数据聚类结果对微博分词的影响不显著。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号