首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
针对关联规则负增量更新的挖掘问题,提出了一种高效的关联规则负增量更新算法,即NIUA。该算法充分利用原数据库中已有的频繁项集、所有1-项集来生成最小非频繁项集;并采用选样等策略求出删减数据后的频繁项集。整个算法只需扫描删减后的事务数据库一遍,从而提高了关联规则的更新效率。  相似文献   

2.
针对传统关联规则 Apriori 算法难以适应大数据的问题,为提高可信计算平台日志数据分析效率, 提出了一种基于Hadoop的可信计算平台日志分析模型。构建了日志分析模型总体框架,对非结构化原始日志数据进行垂直划分,采用分布式文件存储系统,结合MapReduce编程模式给出一种分布式Apriori并行垂直算法。通过日志挖掘建立用户行为关联规则库,并采用规则匹配实现对用户异常行为的检测。理论分析和实验数据证明,该模型在大数据环境下能够有效提高日志分析效率。  相似文献   

3.
针对分子动力学串行计算速度不足问题,设计一种基于MPI+OpenMP的并行编程模型,实现LAMMPS并行计算。从而满足在节点间采用MPI进行消息传递并行,在节点内采用OpenMP共享内存模式多线程并行;最后根据分子动力学自身计算特点,对近邻表的构建以及力的计算进行优化,同时将并行结果和串行结果以及纯OpenMP运行时间和混合模型运行时间作对比。实验结果表明,采用MPI+OpenMP混合并行编程模型不仅能够加快计算速度,而且具有很好的扩展性。  相似文献   

4.
关联规则挖掘是数据挖掘领域中的一个非常重要的研究内容,其主要目标就是发现数据库中一组对象之间某种关联。频繁项集挖掘是关联规则挖掘的关键步骤,它在很大程度上决定了关联规则挖掘的效率。介绍了Apriori算法及其算法改进。该改进算法对剪枝步进行了优化,提高了连接效率,并且不断减小数据库的规模,去掉无效事务,减少了每次扫描数据库所花费的时间,提高了算法效率。经过试验论证,性能比原有算法提高,具有一定的实用性。  相似文献   

5.
分布式数据库系统中存储了海量数据,在这些数据的背后,蕴涵着大量有价值的知识。这些知识的挖掘已成为继数据库本身研究之后十分重要的方向之一.该文根据分布式数据库的特点,提出了一种在其上的关联规则挖掘系统.该系统利用矩阵工具挖掘局部关联规则,并采用了不确定性推理方法来融合各局部关联规则.从而提高了局部关联规则挖掘效率和和全局关联规则的准确率.  相似文献   

6.
分布式数据库系统中存储了海量数据,在这些数据的背后,蕴涵着大量有价值的知识,这些知识的挖掘已成为继数据库本身研究之后十分重要的方向之一.该文根据分布式数据库的特点,提出了一种在其上的关联规则挖掘系统.该系统利用矩阵工具挖掘局部关联规则,并采用了不确定性推理方法来融合各局部关联规则,从而提高了局部关联规则挖掘效率和和全局关联规则的准确率.  相似文献   

7.
关联规则挖掘算法是数据挖掘领域的主要研究方向之一。对几种经典的关联规则挖掘算法进行了分析、探讨和比较,给出了一种基于支持矩阵的、不需要产生候选项目集的算法设计思想。算法为事务数据库中的每个项目设置二进制向量,利用逻辑与运算构造支持矩阵来挖掘频繁项目集,极大地节省了存储空间,提高了算法运行效率。  相似文献   

8.
计算机软件蕴含大量工作信息,有效挖掘软件数据信息之间的内在关联是信息时代对软件应用的潜在要求。针对经典Apriori算法挖掘数据效率低、复杂度高的问题,提出一种改进Apriori算法用于挖掘计算机软件数据的关联规则。为计算机软件算法设置双重支持度阈值,即频繁项集与非频繁项集支持度阈值,快速获得强关联的频繁项集;在此基础上基于映射规则重构事务数据库,压缩数据库规模,减少算法的剪枝操作,降低计算机软件数据关联规则挖掘复杂度。以人力资源类计算机软件数据为例展开关联分析测试,结果显示,该算法挖掘的关联信息与人力资源实际管理情况一致,相比经典Apriori算法其效率有所提升。  相似文献   

9.
针对多核机群系统的硬件体系结构特点,提出了节点间MPI消息传递、节点内部OpenMP共享存储的混合并行编程技术。该编程模型结合了两者的优点,更为有效地利用了多核机群的硬件资源。建立了单层混合并行的Jacobi求对称矩阵特征值算法。实验结果表明,与纯MPI算法相比,混合并行算法能够取得更好的加速比。  相似文献   

10.
针对多核机群系统的硬件体系结构特点,提出了节点间MPI消息传递、节点内部OpenMP共享存储的混合并行编程技术。该编程模型结合了两者的优点,更为有效地利用了多核机群的硬件资源。建立了单层混合并行的Jacobi求对称矩阵特征值算法。实验结果表明,与纯MPI算法相比,混合并行算法能够取得更好的加速比。  相似文献   

11.
将形式概念分析技术应用于Web使用日志文件的挖掘,提出基于多值属性形式上下文,利用频繁闭项集挖掘Web使用日志生成关联规则的增量挖掘算法。与经典挖掘方法比较,减少了对Web使用日志的扫描次数,提高了挖掘效率,同时还可以进行增量挖掘,满足了实时页面推荐的需要。  相似文献   

12.
大型数据库中关联规则的发现是KDD中一个重要的问题。本描述了关联规则的一般算法,对定量型关联规则的挖掘算法进行了讨论,结合我校智能型学生测评系统,给出了挖掘定量型关联规则的算法。  相似文献   

13.
关联规则挖掘通过发现密切相关项集的方法已经在商业决策中被广泛使用.现针对关联规则挖掘的经典算法Apriori需要重复多次扫描整个数据库导致在空间和时间方面有很大负载的问题,提出了根据研究者所感兴趣的项集作为关联规则的结果,采用对数据库进行类标签压缩来减少迭代次数.通过实验显示该方法可以有效提高Apriori算法的效率.  相似文献   

14.
高性能计算是计算科学的一个分支,研究并行算法和开发相关软件,并致力于开发高性能计算机。目前较为流行的并行程序设计模型为基于消息传递M P I(Message Passing interface)的编程模式,基于共享内存的O p e n M P模式和结合MPI+OpenMP的混合编程模型,以及利用GPU作为并行数据计算设备(GPU计算的模式就是在异构协同处理计算模型中,将CPU与GPU结合起来加以利用,应用程序的串行部分在CPU上运行,而计算任务繁重的部分则由GPU来加速)的MPI+OpenMP+CUDA的三级混合编程模型。本文基于中国科学院近代物理研究所超算中心的深腾7000G集群,进行GPU通用计算能力和并行编程模型的研究,采用MPI+CUDA多粒度混合编程模型,节点间使用MPI进行通信,  相似文献   

15.
结合云计算平台提出了基于子集统计的关联规则算法,该算法能充分利用云计算的并行性特点,只需要扫描一次数据库,比传统的Apriori算法提高了效率,适用于大规模数据的关联规则挖掘.  相似文献   

16.
Apriori算法是整个关联规则算法的基础.它必须对数据库进行重复性扫描.效率低,耗时巨大.针对关联规则的维护问题,提出利用已生成关联规则的挖掘结果进行更新的算法,仅需对数据库进行两次扫描,提高了关联规则的更新效率.  相似文献   

17.
针对经典的Ap606算法耗费大量的时间和空间的特点,提出基于模式矩阵的关联规则算法。该算法扫描数据库次数为一次,降低了挖掘的时间复杂度;扫描后的数据库以矩阵形式存放,减少空间复杂度。并应用具体事例进行验证,对效率进行了比较。  相似文献   

18.
字符串比较是计算机信息处理的重要方法之一。针对现有关联规则挖掘算法不能记忆及利用历史挖掘成果的局限性,提出了将事务数据库转化为项目数据库,构造项目的支持事务标识符有序序列方法。为提高挖掘效率,减少串处理效率较低的负面影响,给出了双序列串比较算法,以及针对串比较的大项目频繁集发现方法。  相似文献   

19.
随着多数据库技术的快速发展,在多个数据库中获取有效信息显得尤为重要。现有技术都是在一个数据库中挖掘间接关联规则。采用投票率作为规则兴趣度量来提取全局间接关联规则,并在此基础上定义了相对支持度和方差来衡量间接规则的强度,以从多个数据库中挖掘有效的间接关联规则。最后通过实验验证了该方法的有效性。  相似文献   

20.
常浩 《太原大学学报》2013,14(2):127-130
数据挖掘是从事务数据库中抽取有用的知识和感兴趣的模式,而从事务数据库中发现关联规则是最常见的挖掘技术之一。提出一个遗传模糊关联规则挖掘框架和综合聚类、模糊和遗传概念的多最小支持度的遗传模糊关联规则挖掘算法。该算法从定量事务数据库中抽取合理的多最小支持度值、隶属函数和模糊关联规则,首先使用k—means聚类算法采集相似项目,然后初始化一个种群设定相同的支持度值,每一个染色体通过需求满足的标准和隶属函数的适应性来评估是否满足其适应度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号