首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
企业积累了大量的客户消费数据,如何从大量的数据中发现用户的消费模式,对企业的营销策略具有重要的指导意义,数据挖掘技术正是可以从大量的数据中挖掘出对企业决策有价值的信息。针对客户数据的特点,提出一种基于Kruskal算法的最小生成树模糊聚类算法KTFC,并将其应用在客户关系管理中。实验证明,该模糊聚类算法可以有效地对企业客户群进行分类,并分析出每类客户的特点,动态地选取不同的λ值可以获得不同的聚类结果,大大地提高了聚类的灵活性。  相似文献   

2.
在大数据时代,数据是由不同来源生成的,或者是从不同视图中观察得到的,这些数据被称为多视图数据。在数据挖掘与分析中,充分发挥知识在多视图数据中的作用是非常重要的,因此需要在融合相关数据的同时,考虑不同视图的多样性。近年来,多视图聚类(MvC)受到越来越多学者关注,根据其涉及的机制和原则,将多视图聚类算法分为5类,即协同训练算法、多核学习、多视图聚类、多视图子空间聚类与多任务多视图聚类。对多视图聚类算法进行介绍,并重点介绍了协同训练算法与多核学习。  相似文献   

3.
数据挖掘中聚类分析算法研究   总被引:4,自引:0,他引:4  
聚类分析是数据挖掘的一个主要研究方向,目前其研究已深入到数据库、数据挖掘、统计等领域并取得了很大的成就.本文介绍了聚类分析的应用及数据挖掘对聚类算法的典型要求,并对现有的传统聚类算法进行了分析与评估.最后介绍了聚类分析最新的研究方向——流数据聚类分析.  相似文献   

4.
聚类分析是当今飞速发展的数据挖掘和数据信息分析的一个重要技术,因此聚类分析已经成为数据挖掘领域一个非常活跃的研究课题.针对空间数据库对聚类算法的特殊要求,分析了空间聚类算法的构造思想及其优缺点,探讨了空间聚类算法目前的工作、算法的一些开放性问题以及今后的研究方向.  相似文献   

5.
针对电子商务系统中大多采取用户评分或购买数据进行聚类,较少进一步分析用户行为的现状,提出一种根据用户浏览商品时序分析用户兴趣的方法 .在此基础上先用Canopy算法进行数据预处理后使用K-均值算法根据用户兴趣实现用户聚类.采用KDD CUP2000数据集中的用户点击流数据中的用户浏览记录对算法进行实验,实验结果表明算法有较好的聚类结果 .  相似文献   

6.
在分析基于工艺元的典型工艺信息组织模式的基础上,提出一种基于数据挖掘技术的从工艺数据中获取工艺元知识的方法.该方法采用文本聚类的思想扫描工艺数据库,将数据库中工艺描述划分为不同的类提取出常用工艺语句并设计了相应的处理算法,通过改进Apriori方法设计的Apriori-seq算法用于对工艺规程序列进行挖掘获取工艺元.同时,开发出在制造工艺序列数据中进行知识发现的原型系统SCU-KDPS,应用表明本文的研究方法有较高的知识发现效率.  相似文献   

7.
差分隐私是能够提供严谨数学证明的隐私保护模型,针对传统差分隐私保护方法在混合型数据集中应用效果差、处理后破坏数据可用性等问题,提出一种面向混合型数据集自适应聚类的差分隐私保护算法.结合快速聚类及k-prototype聚类算法的特点,首先根据混合数据集的不同数据类型属性,采用不同的相异度计算方式实现对不同数据类型属性的距...  相似文献   

8.
聚类算法是数据挖掘的核心技术,本文提出了评价聚类算法好坏的标准,基于这个标准,对数据挖掘中常用聚类算法作了比较分析.以便于人们更容易、更快捷地找到一种适用于特定问题的聚类算法.  相似文献   

9.
近年来,数据挖掘技术的研究备受国内外关注,其主要原因是信息技术发展产生了大量分散的数据,迫切需要将这些数据转换成有用的信息和知识.此前的研究,主要集中于分类算法及应用方面的研究,但某些特殊领域,如生物信息学研究等,需要通过聚类方法解决一些实际问题.本文从横向深入分析了数据挖掘技术中聚类算法的发展,对层次法、划分法、模糊法,以及量子聚类、核聚类,基于密度和网格等10种聚类算法的原理、过程和特点等都进行了比较详细的分析论述.  相似文献   

10.
以基于数据挖掘方法的入侵检测技术研究为核心,对数据挖掘技术和入侵检测技术进行了研究和分析,探讨了数据挖掘方法中聚类算法在入侵检测中的应用,提出了一种基于最短距离算法的最近邻优先(NearestNeighbor First)算法,并采用KDD Cup 1999数据集中的数据对该算法的执行效率进行检测.  相似文献   

11.
聚类算法是数据挖掘中用来发现数据分布和隐含模式的一项重要技术。通过分析研究数据仓库及数据挖掘中聚类算法的现状,对数据挖掘中常见的几种聚类算法的性能进行相互比较,并分析它们各自的优缺点,对数据挖掘中聚类算法的发展趋势作出展望。  相似文献   

12.
聚类分析是数据挖掘中的一个重要研究领域,是一种数据划分或分组处理的重要手段和方法。聚类无论在商务领域,还是在生物学、Web文档分类、图像处理等其他领域都得到了有效的应用。本文主要研究的是基于迭代思想的聚类算法。  相似文献   

13.
模糊聚类分析在数据挖掘中的应用   总被引:2,自引:0,他引:2  
聚类分析是数据挖掘的主要方法之一,而且能够作为一个独立的工具获得数据的分布状况,集中对特定的聚簇集合作进一步的分析。介绍了数据挖掘过程中常见的数据聚类算法,讨论了聚类分析最新的研究方向——模糊聚类方法。  相似文献   

14.
聚类算法是数据挖掘的核心技术,基于密度的聚类是一类已经被证明非常有效的聚类方法.与DBSCAN算法作比较,文章提出了一种基于密度的聚类算法(Clustering Using Centers and Density,CUCD).该算法是基于中心点以及密度实现的,其核心对象是根据数据分布计算出来的虚拟的点,并且核心对象的代表性随程序的执行次数而提高;经实验验证,该算法具有较好的时间效率和聚类质量.  相似文献   

15.
面向高维数据的聚类分析是当今数据挖掘研究的重要领域,其中的关键问题在于如何对高维数据的聚类结果进行高效率的可视化分析。针对这一问题首先使用了数据聚合树(DA树)作为代表高维数据集的数据结构,并将一个新的聚集算法(CLUK算法)应用于该数据集,获得聚类分析的结果,然后搭建了一个可视化平台(Hvis),最后利用平行坐标法在...  相似文献   

16.
聚类分析是数据挖掘的一个重要研究领域,按照一定的要求和规律将事物进行分类的一种数学方法。将模糊数学的模糊理论应用于数据挖掘的聚类分析中,提出一种快速模糊C-均值聚类算法,并给出模糊聚类分析在数据挖掘中的应用的主要步骤,大大提高计算效率,收敛速度非常快,对大量数据处理是有实际意义的。  相似文献   

17.
数据挖掘领域中的聚类分析及应用   总被引:1,自引:0,他引:1  
聚类是统计学的一种方法,也作为数据挖掘的一个功能被广泛地应用。本文介绍了聚类的概念、应用,主要的聚类算法。最后,针对现实中的一个具体问题,设计了一个层次型的聚类算法,其结果对相关部门具有一定的指导作用。  相似文献   

18.
聚类分析是数据挖掘和机器学习的一个重要分支,应用范围广,但在聚类分析过程中大量敏感信息的泄露对用户构成威胁。因此,在聚类分析过程中实现隐私保护至关重要。传统基于差分隐私(DP)的k-means聚类算法由于存在盲目选择初始中心点、对异常点敏感度较高等问题,导致在保护数据隐私时,出现聚类可用性较低的情况。针对该问题提出一种改进的基于差分隐私保护的(IDP)k-means聚类算法以提高聚类可用性,并进行理论分析和对比实验。理论分析表明,该算法满足ε-差分隐私;仿真实验结果表明,在同一隐私预算下,k-means算法改进后在聚类可用性上优于其它差分隐私k-means聚类算法,在同一数据集与同一隐私参数下,改进k-means算法在数据可用性方面比传统算法提高了将近5个百分点。  相似文献   

19.
关联规则是数据挖掘中一个非常重要的任务,有许多针对于关联规则的挖掘算法,然而需要提高算法的有效性来处理现实世界中的数据集。基于聚类的关联规则挖掘算法法通过扫描数据库创建聚类表,将收集的事务记录放入聚类表中,通过局部聚类表的约束来产生频繁项集,不仅可以剪枝候选项集,降低数据扫描的时间,而且确保挖掘结果集的正确性。实验结果表明,基于聚类的关联规则挖掘算法比Apfiori算法有更高的执行效率。  相似文献   

20.
针对煤炭企业采用的基于关联规则的数据挖掘技术存在的不足,文章提出了一种基于时间聚类的加权关联规则挖掘算法,分析了关联规则的基本概念,简要介绍了传统Apriori算法原理,详细介绍了基于时间聚类的加权关联规则挖掘算法原理及实现.实际应用范例表明,与Apriori算法相比,基于时间聚类的加权关联规则挖掘算法具有较高的准确性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号