首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
关联规则的挖掘分为两步,首先找出满足最小支持度要求的频繁项目集,然后根据频繁项目集生成满足最小置信度要求的关联规则集.目前对关联规则挖掘的研究主要集中在频繁项集的生成上,然而,作为整个关联规则挖掘的一部分,由频繁项集生成关联规则的算法也有待进一步研究和改进.本文首先对传统的集合操作进行了扩展,然后在扩展集合操作的基础上,提出了由已挖掘出的最大频繁项集生成关联规则的算法ARD-ES,并对算法的复杂度作了理论和实验上的分析.实验表明,ARD-ES算法随着事务数据库容量的增大,时间占用的攀升基本上是线性的,空间占用在某一定值上下波动.  相似文献   

2.
计算机软件蕴含大量工作信息,有效挖掘软件数据信息之间的内在关联是信息时代对软件应用的潜在要求。针对经典Apriori算法挖掘数据效率低、复杂度高的问题,提出一种改进Apriori算法用于挖掘计算机软件数据的关联规则。为计算机软件算法设置双重支持度阈值,即频繁项集与非频繁项集支持度阈值,快速获得强关联的频繁项集;在此基础上基于映射规则重构事务数据库,压缩数据库规模,减少算法的剪枝操作,降低计算机软件数据关联规则挖掘复杂度。以人力资源类计算机软件数据为例展开关联分析测试,结果显示,该算法挖掘的关联信息与人力资源实际管理情况一致,相比经典Apriori算法其效率有所提升。  相似文献   

3.
频繁项集挖掘在数据挖掘中是一个十分重要的组成部分,文章借鉴Apriori算法的思想,结合关系数据库的特殊性,介绍了一种基于SQL的频繁项关联规则挖掘算法,并将其应用于教学评价数据的挖掘中,得出一些潜在的关联规则,为教学管理提供了一定的决策支持信息.  相似文献   

4.
为提高关联规则中频繁集挖掘的效率,将频繁集的挖掘转化为TSP问题中最短路径的求解。应用蚁群算法的思想,结合频繁项集的特点对算法进行改进,进而挖掘满足最小支持度的项的组合。实验表明,与传统的Apriori算法相比,改进后的蚁群算法能够在较短的时间里挖掘出大部分的频繁项集,可以有效地进行频繁项集的挖掘。  相似文献   

5.
针对关联规则负增量更新的挖掘问题,提出了一种高效的关联规则负增量更新算法,即NIUA。该算法充分利用原数据库中已有的频繁项集、所有1-项集来生成最小非频繁项集;并采用选样等策略求出删减数据后的频繁项集。整个算法只需扫描删减后的事务数据库一遍,从而提高了关联规则的更新效率。  相似文献   

6.
网络日志数据量日益增大。如何从巨大的网络数据中提取有效信息是数据研究人员一直关心的问题。入侵模式挖掘系统(Intrusion Digger)结合了数据挖掘技术与入侵检测技术,旨在通过发现关联规则而对网络数据进行判别。最小支持度小于所有支持度的项集称为频繁项集,简称频集。基于划分改进的Apriori算法明显优越于原来的算法。基于划分改进的Apriori算法为入侵模式挖掘系统的设计提供了重要的理论支持。  相似文献   

7.
关联规则挖掘用于发现大量数据中项集之间有趣的关联或相关联系,在关联规则挖掘过程中,频繁项集的产生是最重要的步骤。本文提出一种新的频繁项集生成算法,基于项分组的思想,利用矩阵来存储各项的频率信息.只需扫描数据库一次。由于对项进行了分组,充分利用了各个事务的重复信息,因此在项数很多时算法效率仍然较高,实践证明,这是一个高效的频繁项集生成算法。  相似文献   

8.
数据挖掘是目前数据库界广泛研究的课题,而频繁项集的挖掘是关联规则挖掘、序列模式挖掘、相关分析挖掘、聚类模式挖掘和回归模式挖掘等问题中的关键步骤.该文介绍了频繁项集挖掘算法的相关概念,对目前频繁项集挖掘典型算法进行了分析和比较,并作出了适当的评价.  相似文献   

9.
Apriori算法是关联规则挖掘技术中的一个经典算法。笔者通过对该算法的思想和性能分析,认为它存在两方面的不足。本文提出了一种提高频繁项集挖掘算法效率的优化方法。实验表明,该优化算法对提高频繁项集挖掘算法的效率是有效的。  相似文献   

10.
在挖掘关联规则的过程中,关键步骤是产生频繁项集.文中提出一种有效的频繁项集挖掘算法—FLMA.算法利用逻辑运算挖掘频繁项集,不产生候选项集,且只需扫描数据库一次,所以此算法是非常有效的.  相似文献   

11.
为了解决MINWAL(O)算法存在的重复扫描数据库、挖掘出的加权频繁项集可能包含多个权值较低的项目等问题,提出一种新的加权关联规则算法.该算法定义了新的加权关联规则模型,提出最小支持期望的概念用于候选项集的修剪,挖掘出感兴趣的加权频繁项集.测试结果证明该算法有较高的时间效率.  相似文献   

12.
发现关联规则是数据挖掘技术的重要任务之一。之前提出的绝大多数算法需要多次遍历数据库才能产生频繁项集,造成巨大的CPU和内存开销。根据网上交易数据海量的特点,提出了一种基于频繁模式增长(FP-growth)的并行算法。该算法可以在不产生候选集的基础上并行的挖掘海量数据。试验证明该算法可以缓解了项目数量巨大而内存不足的矛盾,减少了算法的执行时间。利用该算法对网上交易进行关联规则挖掘,发现了有价值的决策支持信息。  相似文献   

13.
对数据关联规则挖掘中最为消耗系统资源的步骤——搜寻频繁项集作了深入的描述,在对已有数据关联规则挖掘算法的分析基础上,提出了基于Fp—Growth算法的数据关联规则挖掘改进的Fp—Growth算法,开发了无锡交通高等职业技术学校的教务管理系统,并通过实验验证了改进的挖掘算法的有效性和优越性。  相似文献   

14.
对多维关联规则挖掘的理论及实现进行了详细的介绍,尤其对基于多维频繁项集的挖掘算法结合实例进行了详尽的阐述和实现。通过选用先进行立方体计算、后进行数据挖掘的OLAM模式,确定了数据挖掘的范围,然后再进行多维关联规则的挖掘。将交互式挖掘嵌入到联机分析系统中来。  相似文献   

15.
经过分析关联规则中Apriori算法存在的不足,为减少对事务数据库的扫描次数,缩减产生频繁项集的时间,列出两种基于哈希表的计算项集支持计数的方法以及利用哈希表来进行项集的地址定位的方法,使得生成频繁项集的效率有所提高。  相似文献   

16.
在远程教育系统的网上考试系统模块中,数据库和数据仓库中的用户交互数据记录了用户对系统的访问行为信息,利用最小支持度和最小置信度,挖掘出频繁项集,对这些信息的分析有利于远程教育教学管理人员和教师掌握学生对知识的掌握情况,从而可以对教学内容加以改进,对教学平台进行优化.  相似文献   

17.
一种基于二进制编码的频繁项集查找算法   总被引:1,自引:0,他引:1  
在数据挖掘中频繁项集的查找时间是影响挖掘关联规则效率的关键因素,Apriori算法是用来找出频繁项集的典型算法,本文针对Apriori算法需反复扫描数据库、产生大量候选项集的不足,提出一种效率更高的基于二进制编码的频繁项集查找算法,该算法找出频繁项集只需一次数据库扫描,不产生候选项集,与Apriori算法相比,算法效率更高.  相似文献   

18.
提出基于云计算平台(以Hadoop为例)应用布尔矩阵Apriori算法进行大数据关联规则挖掘的MR_B_Apriori算法。将Hadoop平台与布尔矩阵Apriori算法相结合,利用MapReduce框架分块处理布尔矩阵,计算出分块数据的频度,合并融合得到大数据集的频繁项集。分析表明MR_B_Apriori算法能够适用于大数据的频繁项集挖掘。  相似文献   

19.
针对关联规则挖掘中传统Apriori算法需要通过多次扫描数据库来发现频繁项集的问题,提出一种基于简单双矩阵的方法来实现频繁项集的发现.该方法仅需要扫描数据库一次,并充分利用项集的出现次数和是否出现逻辑值来获取频繁项集.实验表明,该方法比Apriori算法更高效.  相似文献   

20.
Apriori算法是关联规则挖掘中的经典算法。通过对Apriori算法的基本思想和性能的研究分析,提出了一种基于垂直事务列表的树形结构的挖掘算法,减少了候选频繁项集的数量,提高了挖掘算法的效率。实验结果表明新算法具有良好的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号