首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
提出了一种基于近邻传播聚类的彩色图像分割方法。首先将彩色图像的颜色空间转换到CIE L*u*v*颜色空间,并对变换后的彩色图像进行采样;然后运行给定聚类数目的近邻传播聚类(APGNC),接着对其余未采样数据根据最大相似度规则,分别得到它们的类归属;最后利用形态学的区域合并方法去除独立小区域,得到修正后的图像分割结果。经仿真实验证明,该方法可以实现近邻传播算法在大规模彩色图像分割中的应用,具有较快地处理速度和较满意的分割结果,更符合人类的整体视觉感观。  相似文献   

2.
针对谱聚类算法稳定性较差的问题,提出了一种改进的半监督谱聚类算法。该算法依据图像的颜色、纹理和空间特征进行聚类,通过Bayes距离学习对相似度矩阵的内容进行修正;然后,使用半监督K—means聚类算法对调整后的特征向量进行聚类划分。仿真实验结果表明。较传统谱聚类而言该算法在准确率及稳定性上都有了显著提升。  相似文献   

3.
冒伟 《教育技术导刊》2020,19(3):248-251
为解决传统谱聚类算法在图像分割时计算量大、使用单一特征分割的局限性问题,设计一种融合谱聚类和多特征的图像分割算法。首先进行超像素分割以减少计算量,分别提取每个超像素的颜色特征和纹理特征,构建超像素相似度矩阵|然后采用特征加权方法线性融合颜色和纹理特征的超像素相似度矩阵|最后采用谱聚类算法进行聚类分割。在UCMerced_LandUse和Berkeley数据集上进行实验测试,并与现有方法进行比较。实验结果表明,大多数实验图像IOU指标均在90%以上,相比于传统方法有了显著提高。  相似文献   

4.
提出使用文本相似度算法与DBSCAN聚类算法相结合的方法对文本进行聚类,实现对文本的管理。首先对文本进行特征提取和分词操作,在分词过程中会产生大量的特征词汇,而有些特征词汇对文本特征的表达并无实际意义。因此,在文本特征提取过程中根据特征词汇对文本特征表达的贡献度进行取舍,以提高文本聚类的效率和准确性。利用TF IDF方法对特征词汇进行加权,并且对文本进行相似度计算,将相似度低于阈值的文本作为孤立点进行处理。利用DBSCAN算法对文本进行聚类,将相似的文本聚为一类。  相似文献   

5.
运用图论中的一系列思想对生物序列、蛋白质结构和基因芯片数据进行综合分析,将多物种的序列进行聚类,为生物基因的功能研究提供了新的思路.其算法首先根据生物序列的相似度、蛋白质结构的相似度和基因芯片数据的相似度建立一级图,然后根据一级图建立二级图,进而通过二级图的分析来挖掘基因的聚类关系.算法聚类的结果可以对各种基因的功能进行预测,可广泛应用于后基因组计划的基因和蛋白质研究.  相似文献   

6.
随着互联网的日益普及和电子商务的迅速发展,基于Web日志挖掘聚类算法的电子商务在市场中竞争越来越激烈.本文首先概述Web使用挖掘,简单介绍日志挖掘技术中两个关键技术,聚类分析和序列模式挖掘,进而讨论Web日志挖掘的数据预处理过程,包括用户,数据净化,路径补充等.对于传统的矩阵聚算法进行优化,应用该算法可以对客户和页面进行聚类分析,达到发现相似的客户群体,挖掘潜在客户群.通过实验表明改进的算法具有较高的扩展性和准确性,证明将挖掘结果应用于个性化推荐系统的思想是可行有效的.  相似文献   

7.
Kmeans算法存在两个主要缺陷,导致聚类结果准确率较低。为改善聚类效果,提出一种DGK-Kmeans算法。该算法选用核密度估计处理数据,得到备选聚类中心,依据平均类间相似度动态增加初始聚类中心个数,直至平均类间相似度大于前次计算值时,选取平均类内相似度最小时对应的聚类中心为初始聚类中心,进行Kmeans聚类计算。采用UCI标准数据集进行实验,证明改进后的DGK-Kmeans算法在聚类准确率和稳定性方面有很大提高。  相似文献   

8.
由于向量空间模型在文本聚类中的应用,而必须对文本特征进行降维。本方法首先利用特征的概率分布计算特征之间的相似度,在此基础上对特征进行聚类;然后在文本聚类的结果上计算各个特征的信息增益值;最后在各个特征类上取出一定比例的最重要的特征达到特征选择的目标。实验表明,该改进算法在聚类的准确度方面较以前的方法有所提高,可以有效地用于文本自动聚类。  相似文献   

9.
针对文本类型数据的分类进行研究,用VSM模型和TF IDF技术对文本文件进行了数据样本抽取加权,得到文本相似度矩阵;采用不同样本距离计算方法和K-Means算法对数据进行了聚类实验,获得聚类结果并进行了分析和总结;基于实验结论,研究了不同距离计算方法之间的区别以及适用的数据类型。  相似文献   

10.
K-means算法作为较为普遍的聚类算法,聚类效果受孤立点、噪声点和初始聚类中心影响较大。结合Isolation Forest算法计算数据中每个样本的异常度系数,根据离群值过滤比例计算得到异常度系数阈值,对高度异常值加以隔离,并对隔离后的数据集使用平均插值法求得初始聚类中心。运用改进K-means算法对真实数据集进行聚类分析,与此同时,通过比较多个离群值过滤比例下的聚类结果,找到离群值过滤比例的最优取值。仿真结果表明,相比于原始算法,新算法显著提升了聚类准确性,聚类效果更佳。  相似文献   

11.
娱乐方式日益丰富,产生巨量数据,利用这些数据通过推荐系统可以让用户获得更好的体验,为此提出了DB-CF(DBSCAN-Collaborative Filtering)算法。首先,使用DBSCAN聚类算法对音乐平台的线下用户进行聚类|然后,通过协同过滤算法计算对象用户与各聚类中心的相似度,再通过对比相似度度量矩阵,遍历离对象用户最近的邻居,通过邻居作出评分预测。实验表明,采用DB-CF算法比传统算法准确率提高8%左右,可以产生更准确的推荐结果,为用户带来更好的体验。  相似文献   

12.
协同过滤推荐系统是电子商务系统中最成功、最重要的技术之一,而在协同过滤算法中用户相似度的计算是影响算法效率的重要因素。针对传统协同过滤算法中数据稀疏导致的近邻选择不准确问题,引入灰关联分析理论进行项目聚类和用户相似度计算,并以此为基础提出了一种新的协同过滤算法,既解决了对象匹配的不足,又提高了近邻选择的准确性。实验表明,该算法可以有效解决大规模数据下用户评分数据极端稀疏带来的问题,显著提高系统的推荐质量。  相似文献   

13.
图书智能化推荐是解决高校图书馆馆藏量快速增长与用户对图书资源高效利用之间矛盾的有效方法。研究如何利用读者历史借阅记录构建读者图书类别兴趣度和关注度矩阵,从而隐式地获取读者的兴趣偏好,通过矩阵求得读者之间的相似度,形成具有相近兴趣爱好的读者聚类,从而实现由相似读者群形成一种近邻互助推荐图书的效果。  相似文献   

14.
为有效识别浮动验证码,提出一种基于特征匹配与卷积神经网络的识别方法。首先使用特征匹配的方法得到匹配特征点,结合交叉匹配算法与 K 近邻匹配算法滤除错误匹配;然后对特征点进行聚类及投票分析,得到待识别字符区域,将其分割得到单个字符;最后在 mnist 手写数字数据集的基础上加入英文字符,构建卷积神经网络模型,将数据集送入模型进行训练。对 10 000 张浮动验证码进行测试,结果表明,该方法对浮动验证码的识别准确率达 95%,且构建的训练集具有可扩展性,可进一步应用到其它类型的字符识别中。  相似文献   

15.
一种基于向量空间模型的文本聚类方法   总被引:3,自引:0,他引:3  
研究了一种基于向量空间模型的文档聚类方法.提出了一个新的聚类模型,即在传统聚类模型的基础上增加一个文档特征向量调整模块;给出了一个特征评价函数用以进行特征提取;对一种基于相似度的平面划分聚类算法做了一些改进.实验结果表明本文提出的聚类模型是可行的.  相似文献   

16.
提出一种新颖的基于谱聚类的音频聚类算法,首先对音频数据进行预处理,得到三维音频向量,然后根据向量之间的距离计算音频相似度,最后设计谱聚类算法获得音频数据聚类结果。在网易云音乐数据上的对比实验表明,与K means算法和快速查找密度峰值聚类算法相比,该算法获得的聚类结果更加优越。  相似文献   

17.
在生物学研究中,需要对基因进行分类,以获得对种群固有结构的认识,有效鉴别基因表示数据的模式是研究DNA序列的重要基础。在已有最大树聚类理论基础上,引入模糊聚类思想,提出了最大树基因聚类算法,同时将该方法用于基因的聚类分析,实验结果表明它们是有效可行的。  相似文献   

18.
仿射传播聚类算法是一种比较新的基于质心的聚类算法,在图像分割领域得到了广泛应用。仿射传播聚类算法最终聚类数目会受到偏向参数P(Preference)的影响,得到的聚类数目往往偏多,影响分割质量。鉴于此,提出一种改进的仿射传播聚类的图像分割算法,该算法将仿射传播聚类算法与CURE层次聚类算法相结合,CURE算法能够对仿射传播聚类算法的分割结果进行优化。实验验证表明,改进后的算法图像分割效果更好。  相似文献   

19.
利用空间坐标和属性特征的有机结合,定义了3种曼哈顿空间距离,用matlab编程给出了基于该空间距离的ACA-Cluster聚类算法,并对山东省生态环境质量进行了聚类分析和类型分区。实验表明,该方法可以较好地反映出空间位置邻近和属性特征相似的空间聚类要求。  相似文献   

20.
为了解决数据高维、海量导致聚类算法处理效果不佳的问题,提出将流形学习理论引入客户关系管理进行聚类研究。为了较好的分析客户价值,在Kmeans聚类的基础上引入流形学习理论。客户价值分析一般包含数据的抽取、探索以及预处理、模型建立几个步骤。在模型建立过程中一般采用Kmeans聚类实现。使用流形学习的谱聚类来替代Kmeans聚类。使用泰迪杯数据挖掘大赛中的数据进行试验,通过实验的雷达图可以看出,谱聚类与Kmeans聚类具有相似的分类构成。同时对于分类后的数据进行规约并绘制散点图,比较后发现,谱聚类后的数据类间相似度比Kmeans高,表明将流形学习方法引入客户价值分析,对于聚类稳定性有一定改善。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号