首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
为了更好的对户外运动资源进行整合,以提高资源利用率,本文采用数据挖掘技术构建了一种并行拓展及关联分析的户外运动资源整合模型。首先将整个数据集随机分割成若干个非重叠子数据集,并且每个子数据集还可继续划分成更小的子集,进而并行分层地挖掘出局部频繁项集,然后根据频繁项集先验性质,连接局部频繁项集得到全局候选项集;最后扫描数据集统计出每个候选项集的实际支持度,以确定全局频繁项集。算法实例仿真结果表明,本文提出的改进算法与普通Apriori算法相比更高效,并且在户外运动资源整合的应用中,本文提出的算法表现出更好的挖掘效率。  相似文献   

2.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。提出了一种新的Apriori的改进算法,该算法在生成k(k>1)项频繁集时,不需要重新扫描数据库,只是在生成1项频集时,才需要扫描事务数据库,有效地减少了对事务数据库的读操作,在时间复杂度上较经典的Apriori算法有更加优越的性能。  相似文献   

3.
关联规则在数据挖掘中扮演着十分重要的角色,而Apriori算法和FP-growth算法是当前关联规则中两大主要算法。其中Apriori算法的主要开支是产生大量候选项集和重复遍历数据库,FP-growth算法的主要开支是重复创建和遍历条件FP树。在介绍两种算法基础上,提出了一种新的算法,使Apriori算法产生的候选项集不是查找数据库而是查找FP-tree来确定是否为频繁项集。实际测试表明,在一定的条件下,新算法的效率高于原先的两种算法。  相似文献   

4.
陈静 《大众科技》2012,(6):46-47
关联规则的提取是数据挖掘中的重要研究内容,对关联规则提取中的Apriori算法进行了分析与研究,针对该算法的运算效率不高,对该算法进行了改进,提出了Apriori改进算法.Apriori改进算法采用二进制数据垂直表示方法,只用扫描事务数据库一次得到一阶大项集的二进制数据垂直表示.K阶候选项集的操作只要基于这个一阶大项集,而不需重复扫描数据库,从而提高了挖掘算法的效率.  相似文献   

5.
针对Apriori算法的存在产生大量的候选频繁集合的缺点,本文提出了基于加权代价敏感的非频过滤矩阵Apriori算法,通过在FP-tree算法的基础上构造的决策树对应的数据进行代价敏感学习;设定不同的数据的权值,设定加权置信度;非频集过滤矩阵寻找频集,生成强关联规则;构成非频集过滤Apriori算法对应的初始矩阵;构建代价敏感的非频集过滤矩阵等措施提高了算法的挖掘效果。  相似文献   

6.
本文提出了一种改进的Apriori算法。解决经典的Apriori算法的瓶颈,通过对数据库中小于最小支持度的项集进行剪枝,减少数据库中的事物数量来提高下次扫描的效率,同时改变产生候选集的函数,生成连续的访问页面。改进算法提高了网上学习模型的智能性。  相似文献   

7.
挖掘最大频繁项目集是数据挖掘领域的一个重要的研究内容。Apriori算法作为一种挖掘频繁项目集的基本算法,其缺点是产生大量的候选项目集,算法的代价很大。本文在基于FP-Tree的基础上提出了挖掘最大频繁项目集的新算法FP-GDMA。该算法采用自顶向下和自底向上相结合的搜索策略有效减少了生产候选项目集的数目,有效提高了挖掘最大频繁项目集的效率。并通过实验比较FP-GDMA与DMFIA算法。  相似文献   

8.
徐浙君 《科技通报》2019,35(2):54-58
云计算下的数据挖掘一直都是研究的重点,本文以基本的Apriori算法为基础,提出了构建适合云计算下的数据集分解方式,减少扫描数据库次数和减少频繁项集自连接比较次数的三个策略,并从挖掘频繁1项集,2项集和多项集进行描述。仿真实验中将本文算法与基本Apriori算法、改进的Apriori算法进行比较,取得了比较好的效果。  相似文献   

9.
关联规则是数据挖掘的重要研究方向之一,Apriori算法是利用关联规则进行数据挖掘中的一个最经典的算法。通过对Apriori算法进行研究分析,发现该算法具有产生大量候选项集和多次扫描数据库的缺点。提出了一种基于矩阵按位存储的改进型Apriori算法,该算法将数据库中的数据读入内存,用矩阵按位存储数据,使用按位运算计算项集的支持数,提高了支持数计数的效率,从而提高了关联规则挖掘的速度和效率。  相似文献   

10.
针对标准Apriori算法在旅游市场数据规则挖掘的应用中还存在运算时间长、规则挖掘效果不好等问题。本文提出了一种基于动态置信和事务数据库优化的数据挖掘模型,首先采用贝叶斯算法对数据项进行预估,得到动态的置信度,然后采用m-estimate加以优化,从而让该分类能够更为精确地做出其适当的分类,最后用矩阵的形式来代替事务数据库,并通过这一方法来提高算法的运行效率。另外针对这一模型进行了仿真实验,结果发现,本文设计的经过改进的Apriori算法在挖掘市场数据的时候具有更好的性能。  相似文献   

11.
将多参数随机干扰与Pailler同态加密进行结合,提出一种新的基于隐私保护的面向关联规则的水平分布式挖掘算法,提高了面向关联规则的分布式隐私保护的安全性能。算法中计算候选项集的局部支持度是通过多参数随机干扰求得的,一方面具有不同事物所有相的性质,另外一方面改善了挖掘的准确。通过使用同态加密技术获得的整体支持度,有效控制了计算与通信的成本。分析仿真实验结果可知本文提出的基于隐私保护的面向关联规则的水平分布式挖掘算法性能比单纯以加密为基础的PPDAR算法优良,当最大频繁项集的最大长度与频繁项集的最大长度两者存在一定差距时,本文提出的算法性能优于以加密为基础的EPPDAR算法。  相似文献   

12.
翟悦 《科教文汇》2011,(4):89-90
针对传统的Apriori算法需要产生大量的候选项目集和多次扫描数据库的不足,提出了一种新的基于内积运算的频繁项集生成算法。该算法对事务数据库布尔化表示,通过内积运算搜寻矩阵行向量直接生成频繁项集,打破了频繁项集必须从低次到高次的局限,当频繁项集可能是大项集时,大大提高了搜索效率。  相似文献   

13.
Web页面包含复杂的、无结构的、动态的数据信息,包含大量的、不完全的、有噪声的、模糊的、随机的数据,干扰了正常的提取过程.为此提出一种改进Apriori算法的海量Web数据高效挖掘方法.在自然连接产生候选集以前先进行一个修剪过程,减少参加连接的项集数量,因而减小生成的候选项集规模,减少了循环迭代次数和运行时间,同时在连接判断步骤中减少多余的判断次数.实验表明,该方法能够迅速排除冗余数据干扰,提高了挖掘的准确性.  相似文献   

14.
王昱  陈仪香 《中国科技信息》2007,24(20):78-78,80
从Apriori算法可以看出,每次对数据库的扫描时,有些事务已经对频繁项目集的生成不产生作用。减少数据库内与进一步挖掘任务不相关的事务对于算法来说很有必要。本文不同于传统的事务压缩方法,设计了新的基于数据集削减法的Apriori算法。  相似文献   

15.
针对标准C4.5算法在词性分析的应用中表现出精确性不高、运算速度不快的问题,本文提出了一种基于候选属性规则优化C4.5算法的词性分析模型,首先以信息增益的思想为鉴,辅之以关联规则,制定一个与参数支持度和可信度相近的评价标准,由此来对候选属性规则进行优化,之后再在信息增益率计算过程中,降低决策树的计算成本由此来节省决策树的生成时间。本研究还进行了专门的仿真试验,实验结果表明,与标准算法相比,本文设计的改进模型在精确性和运算速度方面都有更好的效果。  相似文献   

16.
Apriori算法是关联规则挖掘中的经典算法。通过对Apriori算法的基本思想和性能的研究分析,提出了一种基于垂直事务列表的树形结构的挖掘算法,减少了候选频繁项集的数量,提高了挖掘算法的效率。实验结果表明新算法具有良好的性能。  相似文献   

17.
结合了分布式入侵检测技术和数据挖掘技术,对基于数据挖掘的分布式入侵检测系统进行了研究.在对经典的关联规则挖掘Apriori算法改进的基础上,提出了适用于分布式入侵检测系统中基于网络数据源的关联规则挖掘DZApriori算法.  相似文献   

18.
基于Apriori算法的高校教学评价数据挖掘   总被引:2,自引:0,他引:2  
高校在教学和管理中积累了大量的数据,本文把数据挖掘技术中的关联规则挖掘算法Apriori应用于教学评价中,通过对这些数据分析,找到高校教师的教学效果与教师的年龄、职称、学历等相关.  相似文献   

19.
陆觉民  郑宇 《现代情报》2007,27(12):92-93,98
Apriori算法是关联规则挖掘的一个经典算法,本文在分析关联规则挖掘算法的基础上,提出利用矩阵的数据挖掘技术对经典Apriori算法进行改进,从而提高图书馆数据资源的利用率,提高图书馆服务层次。  相似文献   

20.
Apriori算法是关联规则挖掘的一个经典算法,针对Apriori算法的不足,提出了基于邻接矩阵的算法,该算法首先用邻接矩阵将事务数据库表示出来,然后基于邻接矩阵生成频繁k_项集。以高校图书馆借阅历史数据的挖掘为例,详细描述了事务数据库相应的邻接矩阵生成算法、k_项集生成算法以及相应的数据结构设计,算法均采用C语言描述。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号