首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 602 毫秒
1.
Fuzzy C-Means(FCM)模糊c均值聚类算法是一个应用广泛、有效的无监督聚类算法。但传统FCM算法存在对所有样本等划分的缺点,导致聚类精度不高、鲁棒性不强。针对上述问题,从整体上引入点密度关系,从局部上引入点邻域信息,用以标记每个样本点,提出基于点密度和邻域信息的模糊c均值算法(DLFCM)。该算法能标记每个不同的样本,克服了FCM算法等划分的缺点,提高了算法的聚类精度和鲁棒性。人造数据集和UCI真实数据集实验验证了该算法的有效性。  相似文献   

2.
王瑞  周晨曦  逯静 《教育技术导刊》2017,16(10):150-153
为了提高短期电力负荷的预测精度,提出了一种短期电力负荷预测模型。该模型包括蚁群算法优化的BP神经网络模型和灰色理论模型。蚁群算法优化的BP神经网络可以提高BP神经网络预测精度和收敛速度,灰色理论削弱了数据自身的随机性。结合两者优点,根据电力负荷的数据特征和两种子模型的预测误差,得出其在组合模型中所占权重,然后得到基于组合模型的预测值。应用组合模型对河南省某地区进行短期电力负荷预测,结果表明该方法比单个模型预测精度更高,能有效预测短期电力负荷。  相似文献   

3.
提出一种改进的多流形谱聚类(SMMC)模型,提高复杂流形结构中的聚类精度。改进模型的核心在于首先对原始数据进行空间映射,得到能体现原始数据流形结构的数据;其次,根据流形距离的定义,利用局部点邻域构造各点的切平面,将切平面参数作为新流形的数据样本;最后用SMMC模型求解,得到聚类结果。实验结果表明,改进的SMMC模型对独立子空间、非线性良分离以及非线性交叉流形这三类数据的子空间聚类效果良好,且具有强鲁棒性和通用性。  相似文献   

4.
针对工业生产过程中的时变性问题,提出贝叶斯网络框架下的自适应质量变量预测建模方法.采用改进的即时学习策略,将数据库分成若干局部数据子集,快速选择与待测样本相似度较高的一组数据作为训练样本,再利用主成分分析对训练样本过程变量进行特征提取,借此作为网络模型输入变量.利用基于改进Figueiredo-Jain算法的EM算法估...  相似文献   

5.
提出了结合数据预处理和灰色模型(GM)的最小二乘支持向量机(LS-SVM)短期负荷预测模型和算法.该模型在数据预处理的基础上,根据时刻T,通过缩小的样本集建立灰色模型,利用灰色模型的预测结果构建最小二乘支持向量机,最终,通过建立的最小二乘支持向量机对预测时刻进行预测.该算法不仅通过数据预处理策略提高了预测精度,而且避免了组合预测模型中权值选择问题.采用上述方法对河南电网负荷进行了预测分析,结果证明了该方法的有效性.  相似文献   

6.
为准确快速地对恐怖袭击事件进行分级,帮助建立恐怖袭击事件应急预案,提出一种基于模糊聚类算法和模拟退火遗传算法优化BP神经网络的恐怖袭击事件分级模型。通过模糊聚类算法划分样本训练集,利用BP神经网络的自学习能力获取输入与输出之间的模糊规则,采用模拟退火遗传算法提高神经网络精度。以GTD数据库样本为例,经实验得到普通BP神经网络的分级正确率为94.32%,模拟退火遗传算法优化的BP神经网络分级正确率可提升到99.88%,验证了基于模糊聚类算法和模拟退火遗传算法优化BP神经网络分级模型的有效性。  相似文献   

7.
随着经济的不断发展,用电量的急剧增加,短期预测成为各个供电部门一个不可或缺的部分。电力负荷受多种因素影响,针对短期负荷预测,提出一种考虑各种影响因素的新算法,该方法首先利用模糊C均值聚类方法对历史样本进行聚类,依据输入样本的相似度选取训练样本,然后在选取的样本上,利用遗传算法实现负荷影响因素的提取和支持向量机参数的选择,最后利用支持向量机建立预测模型。采用上述方法对河南电网负荷进行了预测分析,结果证明了该方法的有效性。  相似文献   

8.
针对Kmeans算法对海量数据聚类效率过低的不足,基于Hadoop的分布式架构思想,提出一种多核果蝇-Kmeans聚类算法(MKFOA-Kmeans)。以每次迭代后果蝇位置为聚类中心进行一次Kmeans聚类算法,综合了果蝇优化算法强全局搜索能力以及Kmeans算法强局部搜索能力的优点。MapReduce框架简化了算法执行过程,避免了由于存储空间不足而造成的算法失效。在由普通硬件搭建的Hadoop平台下进行仿真实验,表明MKFOA-Kmeans算法对大数据的聚类准确率高,并且随着数据量的增加,聚类效率优势也愈加明显。  相似文献   

9.
由主动进化思想提出一种基于中心定位算子的遗传算法(GCOGA)。GCOGA算法通过对聚类中心的个数和选取进行指导,解决了常规k-means聚类方法对初始聚类中心的敏感性以及聚类结果与样本输入次序有关等问题。实验结果显示,该算法避免了k-means方法中对初始值敏感和容易陷入局部最优解的缺陷,使聚类更合理,效果更好。  相似文献   

10.
嵌入式网络数据库优化访问的关键是对访问目标数据的准确推荐和挖掘,以实现数据的准确检索。提出一种基于模糊C均值聚类的嵌入式数据库并行推荐算法,构建嵌入式数据的数据结构模型,进行数据信息流属性集特征提取。采用模糊C均值聚类算法实现属性分类,以此实现嵌入式数据的库并行推荐和挖掘。仿真结果表明,采用该算法进行数据库访问,精度较高,执行时间较短,性能优越。  相似文献   

11.
将GM(1,1)模型与BP算法相结合建立灰色人工神经网络组合模型应用于GDP总量的预测。以安徽省1992-2007年的数据为例,对2005至2007年的GDP总量进行检验性预测,结果表明灰色人工神经网络组合模型大大提高了预测精度.  相似文献   

12.
传统欠采样方法在处理不平衡数据问题时只考虑多数类样本的绝对位置而忽略了其相对位置,从而使产生的平衡数据集存在边界模糊问题。提出一种改进 K 均值聚类的不平衡数据欠采样算法(UD-PK)。该算法首先利用改进的 PSO 算法迭代寻找全局最优解作为 K-means 聚类所需初始值,然后通过 K-means 进行聚类,再按照每个类别中多数类与少数类的比例定义所取多数类样本个数,并根据多数类样本与簇心距离择优选择参与平衡数据集构造。在 UCI 数据集上的对比试验表明,该算法在少数类准确率上较一些经典算法有很大提升。  相似文献   

13.
针对传统协同过滤推荐算法在大数据环境下存在数据稀疏性及计算复杂性等问题,提出一种双向聚类协同过滤推荐算法。该算法首先从用户维度和项目维度两个方向分别进行属性聚类,然后在目标用户和目标项目所在类簇中分别使用改进后的相似度计算方法进行协同过滤推荐,最后通过平衡因子综合预测评分并形成最终推荐列表。在 MovieLens 公开数据集上进行实验,结果表明,该算法(DCF)相比传统协同过滤推荐算法(TCF)、基于用户聚类的协同过滤推荐算法(UCF)以及基于项目聚类的协同过滤推荐算法(ICF),在平均绝对误差上分别降低了 16%、8.1%、7.5%,有效提高了推荐精度。  相似文献   

14.
针对数据真实的概率分布不符合事先假设的高斯混合模型的情形,提出了一种鲁棒的基于高斯混合模型的聚类方法.首先,提出了一种新的模型选择准则,即完整似然最短信息长度准则.该准则不仅能衡量模型对数据的拟合优度,还能度量该模型对数据分组的性能.然后,将该准则作为聚类的代价函数,提出了一种新的期望最大化算法来估计模型参数.与标准的期望最大化算法相比,新算法能较好地避免不理想的局部最优解.实验结果表明:当数据概率分布模型不符合假设的高斯混合模型时,所提方法可克服现有的基于高斯混合模型聚类方法过拟合的缺点,鲁棒地得到准确的聚类结果.  相似文献   

15.
建立BP神经网络模型对空分制氧氧气提取纯度进行预测.依据BP算法的基本原理、建立网络模型的基本原则和步骤,确定建模对象、网络结构。抽取相关数据进行训练,将训练样本和测试样本进行对比,二者具有相同的拟合能力,能对未知结果做出预测.  相似文献   

16.
随着宏基因组学的不断发展,揭示了微生物菌群在研究中的重要作用。采用K-Means聚类算法对来源于北平顶猴阴道微生物群落OTUs数据集的27个样本进行研究,并与PCA主成分分析法进行对比。K-Means聚类将OTUs数据集分成4个Cluster,而PCA将OTUs数据集划分成5个Cluster。此外,结合样本的元数据-pH,发现样本间的pH值相似性更能与K-Means聚类的分类保持一致。相较于PCA主成分析方法,K-Means聚类能更精确地对OTUs数据集进行分类。  相似文献   

17.
针对模糊C-均值聚类算法(FCM)存在易受初始聚类中心影响和容易陷入局部最优的问题,提出了一种将灰狼优化算法(GWO)和模糊C-均值相结合的新聚类算法(GWO-FCM)。该算法利用GWO算法强大的全局寻优能力对FCM算法的聚类中心进行优化,模拟灰狼优秀的搜寻猎物行为找到一组最佳聚类中心来提高FCM的聚类效果。通过UCI数据集的仿真结果和算法比较验证了该算法的有效性。  相似文献   

18.
K 均值算法(K-Means)是聚类算法中最受欢迎且最健壮的一种算法,然而在实际应用中,存在真实数据集划分的类数无法提前确定及初始聚类中心点随机选择易使聚类结果陷入局部最优解的问题。因此提出一种基于最大距离中位数及误差平方和(SSE)的自适应改进算法。该算法根据计算获取初始聚类中心点,并通过 SSE 变化趋势决定终止聚类或继续簇的分裂,从而自动确定划分的类簇个数。采用 UCI 的 4 种数据集进行实验。结果表明,改进后的算法相比传统聚类算法在不增加迭代次数的情况下,聚类准确率分别提高了17.133%、22.416%、1.545%、0.238%,且聚类结果更加稳定。  相似文献   

19.
在大数据时代,数据是由不同来源生成的,或者是从不同视图中观察得到的,这些数据被称为多视图数据。在数据挖掘与分析中,充分发挥知识在多视图数据中的作用是非常重要的,因此需要在融合相关数据的同时,考虑不同视图的多样性。近年来,多视图聚类(MvC)受到越来越多学者关注,根据其涉及的机制和原则,将多视图聚类算法分为5类,即协同训练算法、多核学习、多视图聚类、多视图子空间聚类与多任务多视图聚类。对多视图聚类算法进行介绍,并重点介绍了协同训练算法与多核学习。  相似文献   

20.
极端学习机(ELM)训练速度快、分类率高,已被广泛应用于人脸识别领域,但是在实际问题中由于数据具有较高维数,导致ELM在有限样本下存在学习不充分的问题。传统对数据进行有效维数约简的方法,没有考虑到数据之间判别信息和小样本问题。为此,提出一种强制性保留算法(FLPP),以保持全部样本与局部样本之间的几何结构,同时类间离散度矩阵加入判别信息,因此避免了样本点重叠和小样本问题。实验结果表明,该算法有效提高了极端学习机的泛化性能和分类准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号