首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 734 毫秒
1.
挖掘频繁项集是近年数据挖掘任务中的关键问题,提高频繁项集的生成效率一直是数据挖掘领域研究的热点之一,研究人员从不同的角度对算法进行改进以提高算法的效率。文章通过集合的交集运算,得到一种新的频繁项集挖掘算法-SetFIS算法,该算法能快速、直观地求出事务数据库的频繁项集。  相似文献   

2.
挖掘频繁项集是近年数据挖掘任务中的关键问题,提高频繁项集的生成效率一直是数据挖掘领域研究的热点之一,研究人员从不同的角度对算法进行改进以提高算法的效率。文章通过集合的交集运算,得到一种新的频繁项集挖掘算法-SetFIS算法,该算法能快速、直观地求出事务数据库的频繁项集。  相似文献   

3.
有效的挖掘频繁项集是挖掘最大频繁项集的关键步骤.为了克服Apriori算法在挖掘最大频繁项集上的不足,以及FP-Tree存储结构算法多次遍历的缺点,本文引进了新的矩阵技术,减少了FP-Tree遍历次数来挖掘频繁项集,提高了挖掘频繁项集和最大频繁项集效率.并以此提出基于FP-Tree的改进算法FPgrowth*和FPmax*.最后实验结果说明,矩阵技术的引进有效的提高了频繁项集和最大频繁项集挖掘效率.  相似文献   

4.
一种基于二进制编码的频繁项集查找算法   总被引:1,自引:0,他引:1  
在数据挖掘中频繁项集的查找时间是影响挖掘关联规则效率的关键因素,Apriori算法是用来找出频繁项集的典型算法,本文针对Apriori算法需反复扫描数据库、产生大量候选项集的不足,提出一种效率更高的基于二进制编码的频繁项集查找算法,该算法找出频繁项集只需一次数据库扫描,不产生候选项集,与Apriori算法相比,算法效率更高.  相似文献   

5.
为提高关联规则中频繁集挖掘的效率,将频繁集的挖掘转化为TSP问题中最短路径的求解。应用蚁群算法的思想,结合频繁项集的特点对算法进行改进,进而挖掘满足最小支持度的项的组合。实验表明,与传统的Apriori算法相比,改进后的蚁群算法能够在较短的时间里挖掘出大部分的频繁项集,可以有效地进行频繁项集的挖掘。  相似文献   

6.
本文在分析经典Apriori算法和FP-growth算法存在问题的基础上,提出了一种基于索引数组的频繁项集挖掘算法.该算法以Apriori算法为基础,通过引入索引数组,有效缩小了候选集的范围,同时,因无需要采用FP树的存储结构,节省内存.通过实验性能分析比较,该算法可以有效提高频繁项集挖掘效率.  相似文献   

7.
针对关联规则负增量更新的挖掘问题,提出了一种高效的关联规则负增量更新算法,即NIUA。该算法充分利用原数据库中已有的频繁项集、所有1-项集来生成最小非频繁项集;并采用选样等策略求出删减数据后的频繁项集。整个算法只需扫描删减后的事务数据库一遍,从而提高了关联规则的更新效率。  相似文献   

8.
关联规则挖掘是数据挖掘领域中的一个非常重要的研究内容,其主要目标就是发现数据库中一组对象之间某种关联。频繁项集挖掘是关联规则挖掘的关键步骤,它在很大程度上决定了关联规则挖掘的效率。介绍了Apriori算法及其算法改进。该改进算法对剪枝步进行了优化,提高了连接效率,并且不断减小数据库的规模,去掉无效事务,减少了每次扫描数据库所花费的时间,提高了算法效率。经过试验论证,性能比原有算法提高,具有一定的实用性。  相似文献   

9.
计算机软件蕴含大量工作信息,有效挖掘软件数据信息之间的内在关联是信息时代对软件应用的潜在要求。针对经典Apriori算法挖掘数据效率低、复杂度高的问题,提出一种改进Apriori算法用于挖掘计算机软件数据的关联规则。为计算机软件算法设置双重支持度阈值,即频繁项集与非频繁项集支持度阈值,快速获得强关联的频繁项集;在此基础上基于映射规则重构事务数据库,压缩数据库规模,减少算法的剪枝操作,降低计算机软件数据关联规则挖掘复杂度。以人力资源类计算机软件数据为例展开关联分析测试,结果显示,该算法挖掘的关联信息与人力资源实际管理情况一致,相比经典Apriori算法其效率有所提升。  相似文献   

10.
随着大数据时代的到来,针对Apriori算法和FP Growth算法在挖掘海量规模数据频繁项集时,存在内存不足、计算效率低等问题,提出一种Aggregating_FP算法。该算法结合MapReduce并行计算框架与FP Growth算法,实现频繁项集的并行挖掘,对每个项进行规约合并处理,仅输出包含该项的前K个频繁项集,提高了海量数据决策价值的有效性。在Hadoop分布式计算平台上对多组规模不同的数据集进行测试。实验结果表明,该算法适合大规模数据的分析和处理,具有较好的可扩展性。  相似文献   

11.
在分析基于工艺元的典型工艺信息组织模式的基础上,提出一种基于数据挖掘技术的从工艺数据中获取工艺元知识的方法.该方法采用文本聚类的思想扫描工艺数据库,将数据库中工艺描述划分为不同的类提取出常用工艺语句并设计了相应的处理算法,通过改进Apriori方法设计的Apriori-seq算法用于对工艺规程序列进行挖掘获取工艺元.同时,开发出在制造工艺序列数据中进行知识发现的原型系统SCU-KDPS,应用表明本文的研究方法有较高的知识发现效率.  相似文献   

12.
字符串比较是计算机信息处理的重要方法之一。针对现有关联规则挖掘算法不能记忆及利用历史挖掘成果的局限性,提出了将事务数据库转化为项目数据库,构造项目的支持事务标识符有序序列方法。为提高挖掘效率,减少串处理效率较低的负面影响,给出了双序列串比较算法,以及针对串比较的大项目频繁集发现方法。  相似文献   

13.
事务识别在Web日志挖掘步骤中至关重要,如果没有高效的识别算法,挖掘的效率将大打折扣。本文详细研究了事务识别的两种模型,介绍并改进了基于最大向前引用模型的识别方法MFP算法,同时对这两种方法进行了比较,结果表时,改进后的MFP算法具有更高的挖掘效率。  相似文献   

14.
结合遗传算法全局优化的特点,本文提出了采用遗传算法与Apriori方法结合的改进算法,并将其应用于关联规则挖掘过程。改进算法具备较好的全局优化的特性,特别是在深度挖掘和小关联度挖掘的方面,较传统算法的效率有所提高。  相似文献   

15.
针对网络学习者及其对案例访问的模糊性提出采用模糊聚类的方法对学习者和案例进行聚类分析。在算法中,以各学习者对案例的访问次数、时间、学习效率等刻画学习者对案例的关注程度建立模糊相似矩阵,再由平方法求出模糊等价矩阵,然后进行聚类分析。通过具体实例阐述算法的计算过程,证明算法实现的可行性和有效性。  相似文献   

16.
提出了对遗传算法中适应度函数的构造,数据的编码等问题的改进方案,通过对"早熟"问题的分析,将改进的自适应交叉概率Pc和变异概率Pm算法应用到遗传算法中。最后给出了一种基于遗传算法的关联规则挖掘算法,并应用一个实例验证了算法的有效性。  相似文献   

17.
为明确中医治疗抑郁症用药规律,融合Apriori优化算法与Relim算法,采用数据挖掘技术进行分析。针对传统Apriori算法频繁扫描数据库从而生成大量候选项集的缺点,改变其原有剪枝方式以减少扫描次数。将改进后的Apriori算法与无需产生候选项集的Relim算法就中医治疗抑郁症的方剂数据进行关联规则分析,并绘制两个算法时间效率图。结果发现,两种算法在挖掘药物频繁项集与关联规则的结果基本相同,通过分析发现,中医常以疏肝、理气、补肾、滋阴等药物为主治疗抑郁症。改进后的Apriori算法可降低数据库扫描次数,较传统Apriori算法运行效率有所提高,Relim算法在空间利用率和时间执行率上均略优于改进后的Apriori算法。两种算法挖掘结果体现出中医治疗抑郁症注重疏肝理气、补肾滋阴、调理气血等特点。基于关联规则的方法可作为中医用药规律分析的重要工具。  相似文献   

18.
增量式更新算法能充分利用已挖掘出的知识来提高挖掘效率,是数据挖掘高效算法研究中一个主要方向.本文首先分析了经典的关联规则增量式更新算法FUP(Fast Updating algorithm)算法的不足,提出了一种改进的关联规则增量式更新算法IIUA(Improved Incremental Updating Algorithm),极大地降低了存储空间和挖掘时间需求,从而提高了整个关联规则挖掘的效率.  相似文献   

19.
对活体虹膜提出了一种新的分窗小波包分解和Hamming距离匹配相结合的识别算法,在特征提取过程中利用了奇异值分解,有效地减少了代码长度,不影响识别效果.实验结果表明,该方法计算速度快,提取特征的效果好,可用于实际的身份鉴别系统.  相似文献   

20.
基于项目增长法高效求解最大频繁项集   总被引:1,自引:0,他引:1  
针对Apriori算法存在的问题提出了一种改进方法.本算法只需对数据库一次扫描,即可得到所有频繁项集;增强了产生候选项的针对性和有效性;提高了候选项的支持事务计数的效率;在求解最大频繁项集时,由于求解过程中无需用到大量的中间结果,节省了内存空间;通过比较分析,本方法提高了挖掘效率和性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号