首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
近年来数据生成和收集技术的发展使得面向科研、管理等领域的数据集十分庞大,从而对海量数据集进行的信息提取变得更加迫切。文章对数据挖掘的概念及所要达到的目标进行剖析,对增量数据库关联规则挖掘算法进行研究,通过举例对数据库关联规则挖掘算法的实际应用进行了分析。  相似文献   

2.
黄名选  陈燕红 《情报杂志》2008,27(4):119-122
以关联规则挖掘技术的发展为主线,将目前的研究方法归纳为五类:项无加权关联规则挖掘、项加权关联规则挖掘、项完全加权关联规则挖掘、负关联规则挖掘和增量挖掘,对这五类挖掘技术进行整体性阐述和比较性研究,指出了一些挖掘技术的局限性,最后展望关联规则挖掘技术在信息检索查询扩展领域中的应用前景.  相似文献   

3.
熊回香  王学东 《情报科学》2013,(9):73-77,98
运用关联规则挖掘标签间的相互关系,并结合典型的划分聚类算法k-means进行Tag资源自动聚类,从而实现对Tag资源重新组织,为用户提供更好地标签导航和浏览机制。并利用豆瓣网上的实例数据验证了算法的可行性和有效性。  相似文献   

4.
数据挖掘技术在警务化管理系统中的应用主要有关联规则分析、学生的分类聚类、信息抽取等。通过建立数据挖掘模型、算法描述等阐述了数据挖掘技术在警务化管理系统中的实现。  相似文献   

5.
文章介绍了数据挖掘的主要技术,即关联规则和聚类算法,并针对北京林业大学数字图书馆数据的具体特点,将这两种关键技术运用到图书馆借阅信息挖掘过程中,通过分析挖掘结果,寻找借阅书刊一些潜在的规律,优化图书馆的馆藏布局,提高个性化服务质量。  相似文献   

6.
基于Web的数据挖掘技术   总被引:1,自引:0,他引:1  
Web数据挖掘有很多研究热点,其中关联规则挖掘是Web数据挖掘领域研究的一个重要方面.本文首先对数据挖掘、Web数据挖掘和Web数据预处理等相关知识进行了阐述;然后研究了关联规则基本理论及关联规则经典算法;最后为了解决现实数据库中每个项目的分配不均匀性和重要性差异,重点研究了加权关联规则挖掘算法.  相似文献   

7.
本文首先介绍了可视化数据挖掘和关联规则的涵义,然后提出了关联规则挖掘的Apriori算法,最后根据此算法并结合一个保险公司的CRM实例设计编写了一个可视化数据挖掘系统,以实现挖掘结果的图形化显示,从而完成可视化数据挖掘技术在保险业客户关系管理中的应用。  相似文献   

8.
随着信息技术的不断发展和财务数据的急剧增加,财务报表舞弊手段愈发高明和隐蔽,已有基于统计的检测方法已不能对财务报表舞弊进行有效检测,本文讨论在财务指标区间离散化的基础上,运用关联分析技术挖掘财务指标与财务舞弊之间的隐含关联关系.首先,介绍财务报表样本和特征指标选择准则,从权威数据库中分别选取了234份财务舞弊样本和234份控制样本,得到13个初始变量.然后,采用基于单纯的拐点区间划分和基于聚类的拐点区间划分方法对样本进行属性离散化,可分别得到59和82个离散变量.最后,运用频繁项集挖掘算法挖掘出财务指标与财务舞弊之间的关联规则,并用于对样本进行识别.实验结果表明,利用基于聚类技术的拐点区间离散化挖掘得到的关联规则可提高模型的识别准确率.  相似文献   

9.
结合了分布式入侵检测技术和数据挖掘技术,对基于数据挖掘的分布式入侵检测系统进行了研究.在对经典的关联规则挖掘Apriori算法改进的基础上,提出了适用于分布式入侵检测系统中基于网络数据源的关联规则挖掘DZApriori算法.  相似文献   

10.
基于多因素方差分析的文本向量特征挖掘算法   总被引:2,自引:0,他引:2  
文本向量特征挖掘应用于信息资源组织和管理领域,在大数据挖掘领域具有较大应用价值,传统算法精度不好。提出一种基于多因素方差分析的文本向量特征挖掘算法。使用多因素方差分析方法得到多种语料库的特征挖掘规律,结合蚁群算法,根据蚁群适应度概率正则训练迁移法则,得到种群进化最近时刻获得的数据集有效特征概率最大值,基于最优划分的K-means初始聚类中心选取算法,先对数据样本进行划分,然后根据样本分布特点来确定初始聚类中心,提高文本特征挖掘性能。仿真结果表明,该算法提高了文本向量特征的聚类效果,进而提高了特征挖掘性能,具有较高的数据特征召回率和检测率,时间耗时较少,在数据挖掘等领域应用价值较大。  相似文献   

11.
关联规则是数据挖掘中一个重要的研究内容。典型的关联规则发现算法是由R.Agrawal等提出的Apriori算法。本文研究了数据挖掘技术中的关联规则算法。对经典的Apriori算法作了全面的分析,指出了挖掘中的关键步骤,提出算法的不足,并给出了算法可以改进的方向。  相似文献   

12.
在当前的复杂数据挖掘方法中,多是基于关联规则进行关联挖掘,一旦数据之间的关联性被大量的冗余关联打破,形成数据的无序性,就会出现挖掘耗时,挖掘错误较多的问题.为了解决这一问题,本文提出一种基于信誉兴趣区间划分的数据优化查询算法.在海量的数据中,针对错综复杂的数据关系,通过信誉兴趣函数对数据进行较为清晰地划分.尤其在关联规则较为混乱的情况下,这种方法能够得到更为准确的数据分类区间.实验结果表明,这种数据挖掘方法针对大型数据库中的海量数据挖掘效果更佳,且挖掘算法速度更快,效率更高.  相似文献   

13.
基于抽样策略的关联规则算法   总被引:1,自引:0,他引:1  
在数据挖掘中应用抽样技术,可以显著提高数据挖掘任务的效率。文章通过研究关联规则挖掘任务的特点,提出了一种新的基于抽样技术的关联规则挖掘算法。  相似文献   

14.
目前大多都是针对两种类型数据发现对照模式来获取相关信息,在多类数据中发现对照模式进行数据挖掘还具有很大的挑战性。现有的关联规则挖掘技术的瓶颈在于需要产生大量的规则,其中有很多都是冗余规则,而已存在的非冗余规则挖掘算法虽然去掉了冗余规则,但还是有很多规则对于特定的应用领域兴趣度太低或不感兴趣,因此给出了一种有效的多类医疗数据挖掘算法。该算法基于统计方法定义了诱因模式和安全模式,实现了在多类医疗数据中发现这两类模式,并在仿真实验中给出了仿真医疗数据清晰直观的因果关系图,而根据新算法产生的规则得出的分类器也验证了新算法的高效性和实用性,且新算法产生的规则提供了精确而且非常有用的信息,可被实际应用在医疗研究以及其它领域中。  相似文献   

15.
王鹤 《中国科技信息》2007,(15):280-281
数据挖掘是在海量的数据中寻找模式或规则的过程。数据挖掘强调的是发现知识,获得的知识类型包括关联规则、分类、回归、聚类、依赖模型等。本文对其中聚类分析技术进行了较为深入地研究与分析,提出基于信息素的蚁群聚类算法PCBP,利用信息素指导蚂蚁移动,用不同速度的蚂蚁来改善聚类质量,并在这个思想基础上提出层次化蚁群聚类方法。为人们研究聚类提供了新思路和新途径,因此本文的研究具有一定的理论和实践意义。  相似文献   

16.
基于数据挖掘技术的专利信息分析   总被引:3,自引:0,他引:3  
马芳  王效岳 《情报科学》2008,28(11):1672-1675
随着计算机技术和网络技术的的发展,各行各业积累的数据量越来越大.而专利信息集是目前世界上最大的技术信息集,几乎囊括了一切应用领域内的技术成果.为了提取隐含在其中的、人们事先不知道但又潜在有用的知识,将数据挖掘技术应用于专利信息分析,如采用聚类算法对专利文本进行挖掘、采用关联规则对专利发明人进行挖掘,以发现用户感兴趣的知识,并使之转化为有效的竞争情报.  相似文献   

17.
关联规则在数据挖掘中扮演着十分重要的角色,而Apriori算法和FP-growth算法是当前关联规则中两大主要算法。其中Apriori算法的主要开支是产生大量候选项集和重复遍历数据库,FP-growth算法的主要开支是重复创建和遍历条件FP树。在介绍两种算法基础上,提出了一种新的算法,使Apriori算法产生的候选项集不是查找数据库而是查找FP-tree来确定是否为频繁项集。实际测试表明,在一定的条件下,新算法的效率高于原先的两种算法。  相似文献   

18.
分析了聚类、分类、关联规则等在IDS中常用的数据挖掘算法,并介绍了DAID这种以数据库为中心的数据挖掘体系架构模型,对其数据处理过程进行展现。  相似文献   

19.
文章认为,数据挖掘就是从大量数据中提取出潜在的、有价值的知识的过程.关联规则挖掘是数据挖掘领域的一个重要研究方向.基于Apriori算法,用Visual Foxpro实现求1-3频繁项目集的方法,该方法扩展后具有一定的实用价值.  相似文献   

20.
尹燕 《科技广场》2007,(5):87-88
本文首先从理论角度分析了关联规则挖掘算法与聚类挖掘算法原理及其应用领域,然后介绍了Aprior算法的实现及封装,并设计了可视化界面,对算法进行了测试。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号