首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 281 毫秒
1.
特征子集的选择是数据挖掘与模式分类的重要方法.本文主要从微粒编码、比较微粒适应值、更新微粒引导者、一致混沌变异和计算步骤五个方面对用于特征子集选择的异步并行微粒群优化方法进行分析,通过实验比对,可以发现这种方法具有良好的效果.  相似文献   

2.
由于向量空间模型在文本聚类中的应用,而必须对文本特征进行降维。本方法首先利用特征的概率分布计算特征之间的相似度,在此基础上对特征进行聚类;然后在文本聚类的结果上计算各个特征的信息增益值;最后在各个特征类上取出一定比例的最重要的特征达到特征选择的目标。实验表明,该改进算法在聚类的准确度方面较以前的方法有所提高,可以有效地用于文本自动聚类。  相似文献   

3.
根据目前应用于入侵监测的算法中普遍存在的对输入顺序敏感,无法自适应地确定参数以及需要大量的训练数据等问题,且k-means算法存在初值选取的问题,因而提出一种新的聚类算法进行入侵行为的监测.该方法的优点是对输入数据顺序不敏感以及能够比较准确地选择聚类的初值.实验中采用了KDD99的测试数据 ,结果表明该方法可以比较有效地检测真实网络数据中的已知和未知的入侵行为.  相似文献   

4.
遗传算法目前在特征向量选取中扮演着重要角色。由于其具有并行、自适应强等诸多优点,广泛受到多个领域的关注。本文首先对遗传算法、谱聚类等基础知识进行概述,其次介绍遗传算法的三个重要过程遗传、变异及交叉算子。最后给出遗传算法进行特征选择的步骤。为研究谱聚类算法中,使用遗传算法进行特征选择提供学习参考。  相似文献   

5.
利用空间坐标和属性特征的有机结合,定义了3种曼哈顿空间距离,用matlab编程给出了基于该空间距离的ACA-Cluster聚类算法,并对山东省生态环境质量进行了聚类分析和类型分区。实验表明,该方法可以较好地反映出空间位置邻近和属性特征相似的空间聚类要求。  相似文献   

6.
为了提高数据集中相似重复记录的检测效率,提出一种基于属性权值的分组聚类算法。该方法在记录集中选取特征属性,通过设定的权值对记录进行聚类,在形成的数据子集中进行字段匹配和记录匹配,来识别相似重复记录,并给出了相关算法。实验表明,该方法能减少字段的匹配次数和记录的匹配范围,节省运行时间,具有较高的查全率和查准率。  相似文献   

7.
一种基于向量空间模型的文本聚类方法   总被引:3,自引:0,他引:3  
研究了一种基于向量空间模型的文档聚类方法.提出了一个新的聚类模型,即在传统聚类模型的基础上增加一个文档特征向量调整模块;给出了一个特征评价函数用以进行特征提取;对一种基于相似度的平面划分聚类算法做了一些改进.实验结果表明本文提出的聚类模型是可行的.  相似文献   

8.
选取初始聚类中心是多数聚类算法的首要步骤,往往影响着聚类的效果。为了避免算法迭代过程中易陷入局部最优的问题,本文提出了一种基于模糊交叉网格的初始聚类中心选取方法。算法通过对数据空间网格化后,以网格交点为中心的邻近网格组成网格空间,根据数据点的隶属度统计每个网格空间的密度,再通过局部最大网格空间选取K个初始聚类中心。在真实数据集上进行实验,结果表明该方法在保证了聚类效果的同时,提高了收敛速度。  相似文献   

9.
提出了一种基于核的聚类方法,增加对样本特征的优化;通过核函数,把数据样本空间映射到一个高维的特征空间;在特征空间对数据样本进行k-中心点聚类,并通过计算类内距离作为适应度准则,取其最优的结果。通过Web日志挖掘中的Web客户聚类应用比较,表明核聚类方法在性能上比经典的聚类算法有较大的改进,从而实现更为准确的聚类。  相似文献   

10.
针对谱聚类算法稳定性较差的问题,提出了一种改进的半监督谱聚类算法。该算法依据图像的颜色、纹理和空间特征进行聚类,通过Bayes距离学习对相似度矩阵的内容进行修正;然后,使用半监督K—means聚类算法对调整后的特征向量进行聚类划分。仿真实验结果表明。较传统谱聚类而言该算法在准确率及稳定性上都有了显著提升。  相似文献   

11.
利用粗集原理完善评估指标体系的方法   总被引:2,自引:0,他引:2  
研究在建立评估指标体系的过程中,利用粗集理论检验和挑选重要指标集的方法;该方法利用熵函数和MDL原理设计出评价指标集与最后评分间因果关系的度量函数,通过分析指标子集与最后评分结果之间的关系,挑选出最有效的指标子集作为最终的评估依据。利用该方法,可以去除指标系统中的无关指标,在不降低评估精度的前提下,简化了指标体系。  相似文献   

12.
为解决单一特征选择方法的局限性问题,提出 Lasso-RF(LRF)混合特征选择方法,并应用于在线短租房源价格问题研究。基于 Airbnb 房源数据,实验首先通过 Lasso 回归进行特征选择,处理特征之间的多重共线性|然后采用随机森林算法精选剩余特征,最终得到 35 个重要特征,并带入 4 个预测模型中进行比较。结果表明,特征之间的多重共线性会影响随机森林算法对特征重要度的度量|LRF-RF 预测模型与 RF-RF 预测模型相比,评价指标 R2 和 MSE 分别提高了 0.005、0.006,同时运行时间缩短 0.267 秒,表明 LRF 混合特征选择方法优于单一的 RF 特征选择方法。  相似文献   

13.
监测与控制钉螺生长区域,对有效控制血吸虫病疫情的传播和蔓延作用十分重要.采用数字图像识别技术,可以高效地实现对钉螺生长区域的监控.面对杂乱、图像部分遮挡、光照变化等复杂背景下的钉螺数字图像识别,提出了解决方案:首先,提取钉螺数字图像的SIFT特征向量集;然后,应用K均值聚类获取更具代表性的特征子集,作为分类器的训练样本集;最后,通过支持向量机方法获得分类器,用于识别钉螺数字图像.实验结果表明,提出的方法能够获得较好的识别效果.  相似文献   

14.
Mutual information is an important information measure for feature subset. In this paper,a hashing mechanism is proposed to calculate the mutual information on the feature subset. Redundancy-synergy coefficient,a novel redundancy and synergy measure of features to express the class feature,is defined by mutual information. The information maximization rule was applied to derive the heuristic feature subset selection method based on mutual information and redundancy-synergy coefficient. Our experiment results showed the good performance of the new feature selection method.  相似文献   

15.
INTRODUCTION Feature subset selection (FSS) is a data miningfundamental problem to select out relevant featuresand cast away irrelevant and redundant featuresfrom an original feature set (Liu and Motoda, 1998).If a feature subset satisfies the FSS measure and hasthe minimal size, it is regarded as the optimal fea-ture subset. Complete search strategy is the way toobtain an optimal feature subset. Branch and Bound(Narendra and Fukunaga, 1977), Focus (Almuallimand Dietterich, 199…  相似文献   

16.
冒伟 《教育技术导刊》2020,19(3):248-251
为解决传统谱聚类算法在图像分割时计算量大、使用单一特征分割的局限性问题,设计一种融合谱聚类和多特征的图像分割算法。首先进行超像素分割以减少计算量,分别提取每个超像素的颜色特征和纹理特征,构建超像素相似度矩阵|然后采用特征加权方法线性融合颜色和纹理特征的超像素相似度矩阵|最后采用谱聚类算法进行聚类分割。在UCMerced_LandUse和Berkeley数据集上进行实验测试,并与现有方法进行比较。实验结果表明,大多数实验图像IOU指标均在90%以上,相比于传统方法有了显著提高。  相似文献   

17.
在分析现有文本水印方法的基础上,提出一种新方案.该方案中文档看成是句子的集合.利用密钥K1,K2和特征函数返回值选择特征词汇子集和可变序的句子子集合,改变该子集合中的句子顺序来嵌入水印信息.为提高方案对水印攻击的抵御性,在多个句子中嵌入相同的水印信息.阐述了该方案的模型和句子变序算法,通过对主要句子层次上的攻击方法的分析,给出了本方案的优势.  相似文献   

18.
基于数据挖掘的医学图像分类方法研究是多媒体数据挖掘的一个重要组成部分。在分析和总结了现有各种特征提取方法的基础上,提出了基于核密度估计聚类和关联规则的医学图像分类算法和关联规则的医学图像分类器框架。该算法先用核密度估计的聚类算法实现医学图像的聚类,在聚类的结果上提取局部特征,在局部特征上用关联规则实现医学图像的分类。实验结果表明可以较好的提高医学图像分类的准确率。  相似文献   

19.
SLAM is one of the most important components in robot navigation. A SLAM algorithm based on image sequences captured by a single digital camera is proposed in this paper. By this algorithm, SIFT feature points are selected and matched between image pairs sequentially. After three images have been captured, the environment's 3D map and the camera's positions are initialized based on matched feature points and intrinsic parameters of the camera. A robust method is applied to estimate the position and orientation of the camera in the forthcoming images. Finally, a robust adaptive bundle adjustment algorithm is adopted to optimize the environment's 3D map and the camera's positions simultaneously. Results of quantitative and qualitative experiments show that our algorithm can reconstruct the environment and localize the camera accurately and efficiently.  相似文献   

20.
一种小波域K-Means遥感图像分类标注算法   总被引:1,自引:0,他引:1  
由于合成孔径雷达图像(遥感)的相干斑噪声数据丰富,导致传统的遥感图像分割方法分割效果不佳,采用学习理论和神经网络改善图像处理性能。根据图像统计特征,采取神经网络语义提出一种高效的图像纹理特征分割方法。首先,利用K-means聚类提取遥感图像的纹理特征,然后根据遥感图像在小波域中的分布特征对其进行滤波,最后利用语义对滤波后的遥感图像纹理特征和灰度组成的矢量进行分割归类,在遥感图像分割中快速标注分类以便于视觉分析。利用区域一致性分割分类,由聚类样本特征匹配进行图像分类标注,对变化检测进行统计分析,过分割或欠分割误差聚类样本不做标注,选取最佳样本聚类k值标注分类结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号