首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
在挖掘关联规则的过程中,关键步骤是产生频繁项集。文中利用逻辑与运算并建立频繁项集支持矩阵,提出一种有效的频繁项集挖掘算法—LA。算法利用逻辑与运算挖掘频繁项集,不产生候选项集,且只需扫描数据库一次,所以此算法是非常有效的。  相似文献   

2.
在挖掘关联规则的过程中,关键步骤是产生频繁项集。文中利用逻辑与运算并建立频繁项集支持矩阵,提出一种有效的频繁项集挖掘算法-LA。算法利用逻辑与运算挖掘频繁项集,不产生候选项集,且只需扫描数据库一次,所以此算法是非常有效的。  相似文献   

3.
Apriori算法是关联规则挖掘中的经典算法。在Apriori算法中,使用频繁项集的先验知识,逐层搜索的迭代方法,通过扫描数据库,累积每个项的计数,并收集满足最小支持度的项,找每个Lk都需要扫描一次数据库。算法的效率随着数据量的增大,频繁项集的增多,算法的效率就非常的低,本文通过对Apriori算法分析,应用散列、事务压缩、划分、抽样等方法,最大可能的减少数据库扫描的次数,快速发现频繁项集,提高Apriori算法的效率。  相似文献   

4.
关联规则挖掘是数据挖掘领域中的一个非常重要的研究内容,其主要目标就是发现数据库中一组对象之间某种关联。频繁项集挖掘是关联规则挖掘的关键步骤,它在很大程度上决定了关联规则挖掘的效率。介绍了Apriori算法及其算法改进。该改进算法对剪枝步进行了优化,提高了连接效率,并且不断减小数据库的规模,去掉无效事务,减少了每次扫描数据库所花费的时间,提高了算法效率。经过试验论证,性能比原有算法提高,具有一定的实用性。  相似文献   

5.
传统的关联规则挖掘技术过于依赖数据之间的关联属性,造成挖掘算法在高冗余知识空间关联规则不明显或者较弱的情况下挖掘耗时。本文提出一种应用与高冗余知识空间的优化数据挖掘算法。该算法首先找出最大频繁项集和频繁1-项集进行区域分类,然后利用已有频繁项集找出所有的其它频繁项集,去除冗余关联环境,节省了计算频繁项集的时间,节约了存储空间,使算法的效率得到提高。仿真实验结果证明了改进算法的可行性和有效性。  相似文献   

6.
基于关系数据库的教学评价数据的关联规则挖掘   总被引:1,自引:0,他引:1  
於实 《科技通报》2012,28(4):99-101
频繁项集的挖掘是数据挖掘中的一个十分重要的组成部分。本文结合关系数据库的特殊性,利用标准SQL语言,提出适合于关系型数据库频繁项关联规则挖掘的算法,应用于教学评价数据的挖掘,得出一些潜在的关联信息,为教学管理提供决策。  相似文献   

7.
经典的Apriori算法可以搜索出所有的频繁项集,因而被广泛地应用于关联规则数据挖掘系统。研究表明:采用一种辅助分析策略,通过对项集规模的计算简化搜索过程,提高算法效率。  相似文献   

8.
研究频繁项集模式挖掘优化问题。传统的挖掘算法常产生大规模的候选项集,并且反复扫描数据库,导致频繁项集挖掘时间过长,空间效率太低。为了改进频繁项集挖掘时时间与空间效率低的问题,提出一种高效频繁项集挖掘算法CPT-Mine。此算法利用编码模式树存储事务数据库中的频繁项集信息,构建FP数组,加快产生频繁项集,引入CPT-Mine算法,快速地挖掘数据库中所包含的频繁项集,无需递归构造条件模式树,只需两次扫描数据库即可生成所有频繁项集。最后的实验证明了该算法能缩短挖掘时间3~10 s,空间效率提高43%。  相似文献   

9.
本文借助ARIZ思想深入研究了关联规则挖掘模式,综合介绍了关联规则的理论基础,进一步明确了项、项集、候选项集、频繁项集、支持度、置信度这些重要知识点,对关联规则进行了多角度的分类,研究分析了关联规则挖掘的经典算法,并对关联规则的评价标准进行了创新研究,引入了主观兴趣度和客观相关性分析,为后续研究和改进关联规则的算法提供了理论基础。  相似文献   

10.
对大数据的频繁项集挖掘是关联规则挖掘的关键步骤,通过有效的频繁项挖掘提高大数据量数据库的访问效率。传统方法中对大数据的频繁项集挖掘采用FP-Growth的粗糙集挖掘算法,扩展性和容错性不好。提出一种基于贝叶斯粗糙集的大数据频繁项挖掘技术,引入后缀项表的概念,通过后缀项表的构建,保留频繁项集的完整信息。构建FP-Tree,生成闭频繁项集,计算样本的密度,并抽取高密度区域的点集作为聚类中心集合,进行后缀项表的构造,按支持度分成若干集合,对各约简集内的属性集合进行融合,用变精度粗糙集的贝叶斯粗糙进行数据挖掘算法改进,仿真结果表明,算法不受可变参数的影响,鲁棒性较高,数据挖掘的准确度较高,运行时间较短。算法将在人工智能和数据挖掘领域具有更广的应用前景。  相似文献   

11.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。提出了一种新的Apriori的改进算法,该算法在生成k(k>1)项频繁集时,不需要重新扫描数据库,只是在生成1项频集时,才需要扫描事务数据库,有效地减少了对事务数据库的读操作,在时间复杂度上较经典的Apriori算法有更加优越的性能。  相似文献   

12.
赵伟 《科技广场》2005,(10):8-12
关联规则挖掘算法为了发现事先未知的关联规则,需要用高效的方法计算出数据库中的大项目集。影响数据挖掘效率的两个因素,一个是数据库大小,另一个是算法的效率。本文算法通过将数据库进行高度压缩,使数据库中的数据量大大减少,同时算法采用逻辑运算方法计算项集的支持数,计算效率较高。  相似文献   

13.
Apriori算法是关联规则挖掘中的经典算法。通过对Apriori算法的基本思想和性能的研究分析,提出了一种基于垂直事务列表的树形结构的挖掘算法,减少了候选频繁项集的数量,提高了挖掘算法的效率。实验结果表明新算法具有良好的性能。  相似文献   

14.
针对频繁项集挖掘时间与空间效率低的问题,提出一种基于New FP-tree的高效频繁项集挖掘算法。此算法利用New FP-tree结构存储事务数据库中的频繁项集信息,无需递归构造条件模式树,仅需两次扫描数据库即可生成所有频繁项集。最后的实验证明了该算法的有效性。  相似文献   

15.
李欣 《情报科学》2018,36(4):95-99
【目的/意义】关联数据发现与个性化信息推送是未来智慧图书馆建设的核心内容。大数据环境下,为了提 高图书馆推送信息的精准度,本文把适合个性化信息推送服务的强关联规则挖掘技术引入到高校图书馆智慧化信 息服务中,研究在图书馆集成管理系统的基础上实现图书的智能查询和个性化信息推送。【方法/过程】在具体的研 究中,由于经典关联规则挖掘需要多次扫描数据库,生成大量的冗余关联规则信息,因此需要重新定义领域内强关 联规则和频繁项目集,提出处理海量数据需要的强关联规则算法。【结果/结论】将改进的算法应用到图书借阅和信 息查询数据的分析中,以减少图书频繁项集的产生,避免冗余规则的挖掘和生成,从而实现关联图书信息的高效挖 掘和个性化推送。  相似文献   

16.
经过分析关联规则中Apriori算法存在的不足,为减少对事务数据库的扫描次数,缩减产生频繁项集的时间,列出两种基于哈希表的计算项集支持计数的方法以及利用哈希表来进行项集的地址定位的方法,使得生成频繁项集的效率有所提高。  相似文献   

17.
频繁项集挖掘算法研究   总被引:2,自引:0,他引:2  
在数据库中挖掘频繁项集是数据挖掘领域的最基本、最重要的问题。自从Agrawal的开创性工作以来,有关研究从未停止过。然而由于其内在的计算复杂性,这一问题并未完全解决。通过描述频繁项集挖掘的特点,并根据解空间的分类对已有各种频繁项集、闭频繁项集、最大闭频项集和不生成频繁项集的挖掘算法进行了分析和比较。  相似文献   

18.
关联规则是数据挖掘的重要研究方向之一,Apriori算法是利用关联规则进行数据挖掘中的一个最经典的算法。通过对Apriori算法进行研究分析,发现该算法具有产生大量候选项集和多次扫描数据库的缺点。提出了一种基于矩阵按位存储的改进型Apriori算法,该算法将数据库中的数据读入内存,用矩阵按位存储数据,使用按位运算计算项集的支持数,提高了支持数计数的效率,从而提高了关联规则挖掘的速度和效率。  相似文献   

19.
基于关联规则挖掘的食品安全信息预警模型   总被引:4,自引:1,他引:3  
顾小林  张大为  张可  浦徐进  曹文彬 《软科学》2011,25(11):136-141
针对食品生产加工的安全问题,建立了基于关联规则挖掘的食品安全信息预警模型,此模型从数据挖掘视角以食品生产加工的检测数据为处理对象,分析数据异常情况,采用改进的关联规则挖掘APTPPA算法,生成关联路径树、寻找频繁项集、最大频繁项和最大关联规则,进而抽取报警关联规则,挖掘导致食品安全问题的因素并进行诊断和预警,最后通过实验验证了预警挖掘模型的正确性和算法的有效性。  相似文献   

20.
将多参数随机干扰与Pailler同态加密进行结合,提出一种新的基于隐私保护的面向关联规则的水平分布式挖掘算法,提高了面向关联规则的分布式隐私保护的安全性能。算法中计算候选项集的局部支持度是通过多参数随机干扰求得的,一方面具有不同事物所有相的性质,另外一方面改善了挖掘的准确。通过使用同态加密技术获得的整体支持度,有效控制了计算与通信的成本。分析仿真实验结果可知本文提出的基于隐私保护的面向关联规则的水平分布式挖掘算法性能比单纯以加密为基础的PPDAR算法优良,当最大频繁项集的最大长度与频繁项集的最大长度两者存在一定差距时,本文提出的算法性能优于以加密为基础的EPPDAR算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号