首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 515 毫秒
1.
传统的关联规则挖掘技术过于依赖数据之间的关联属性,造成挖掘算法在高冗余知识空间关联规则不明显或者较弱的情况下挖掘耗时。本文提出一种应用与高冗余知识空间的优化数据挖掘算法。该算法首先找出最大频繁项集和频繁1-项集进行区域分类,然后利用已有频繁项集找出所有的其它频繁项集,去除冗余关联环境,节省了计算频繁项集的时间,节约了存储空间,使算法的效率得到提高。仿真实验结果证明了改进算法的可行性和有效性。  相似文献   

2.
基于Web的数据挖掘技术   总被引:1,自引:0,他引:1  
Web数据挖掘有很多研究热点,其中关联规则挖掘是Web数据挖掘领域研究的一个重要方面.本文首先对数据挖掘、Web数据挖掘和Web数据预处理等相关知识进行了阐述;然后研究了关联规则基本理论及关联规则经典算法;最后为了解决现实数据库中每个项目的分配不均匀性和重要性差异,重点研究了加权关联规则挖掘算法.  相似文献   

3.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。提出了一种新的Apriori的改进算法,该算法在生成k(k>1)项频繁集时,不需要重新扫描数据库,只是在生成1项频集时,才需要扫描事务数据库,有效地减少了对事务数据库的读操作,在时间复杂度上较经典的Apriori算法有更加优越的性能。  相似文献   

4.
关联规则挖掘是数据挖掘领域中的一项重要研究内容,由于数据库规模的不断动态扩展,迫切需要针对增量式关联规则挖掘的研究。在分析现有算法的基础上,分别从两个可改进的角度出发对算法进行优化:先在关联规则挖掘中,提出一个高效的搜索频繁项集算法,该算法只需扫描一次数据库即可完成所有频繁项集的搜索,然后利用此方法设计出一个新的增量式挖掘算法,在不影响准确率的情况下大大地提高了挖掘效率。  相似文献   

5.
李丹  车国海 《大众科技》2008,15(4):13-15
在现有的网格和数据挖掘技术基础上,研究OGSA面向服务的体系结构,建立了网格平台下的分布式数据挖掘系统模型。基于该模型。对经典关联规则算法FP—tree算法作了改进,提出分布式频繁模式挖掘算法,并对该模型和算法进行了分析、测试、和评估。  相似文献   

6.
通过对各届毕业生生源等特征资料、高考的成绩数据、以及大学各门课的成绩挖掘,提供了一个在教育领域进行合理挖掘的模式。研究了如何把关系数据库的关联规则问题转化为单维、布尔关联规则问题,把关联规则挖掘中的经典算法Apriori算法在实例中进行了具体应用。  相似文献   

7.
关联规则挖掘是数据挖掘领域中的一个非常重要的研究内容,其主要目标就是发现数据库中一组对象之间某种关联。频繁项集挖掘是关联规则挖掘的关键步骤,它在很大程度上决定了关联规则挖掘的效率。介绍了Apriori算法及其算法改进。该改进算法对剪枝步进行了优化,提高了连接效率,并且不断减小数据库的规模,去掉无效事务,减少了每次扫描数据库所花费的时间,提高了算法效率。经过试验论证,性能比原有算法提高,具有一定的实用性。  相似文献   

8.
作为一种传统关联规则挖掘算法,Apriori算法存在许多可以改进的地方。比如它需要反复读取数据库,并且读取次数由项目集合中的项目的个数n来决定,I/O负载与最大频繁集中的项目个数成正相关。为改善这种状况,本文提出一种只读取一次数据库便可挖掘出关联规则的改进算法。  相似文献   

9.
关联规则研究目的是从大型数据集中发现隐藏的、属性间存在的有趣的关联或相关关系。当挖掘的数据不断更新时,如何高效即时的获得所需的结果,设计高效的算法来更新、维护和管理已挖掘出来的关联规则。该文提出了一种高效的增量更新算法,算法通过实例进行分析比较,证明了该算法有效的提高了挖掘的效率。  相似文献   

10.
为解决关系国计民生重要行业事后审计的弊端,本文针对PNARC算法在审计数据关联规则挖掘时存在的置信度约束无效、挖掘精度不高等问题,提出了一种最小相关度优化PNARC算法的审计数据关联规则挖掘模型。首先对置信度进行阈值双重优化,以提高负关联规则的程度,减少不相关的关联规则,然后对最小相关度进行概率分析,降低无关规则的产生几率。仿真实验结果表明,无论在挖掘精度还是算法运行时间上,都具有比PNARC算法更优异的性能。  相似文献   

11.
李勇男 《情报科学》2021,39(11):127-132
【目的/意义】为了发现更全面、更具有普适性的反恐情报信息,本文在单层次关联规则挖掘的基础上研究 反恐情报的多层次关联规则挖掘方法。【方法/过程】根据反恐情报的数据特征提出统一最小支持度和多单项最小 支持度参数并用的方式筛选多层次涉恐特征频繁项集,在情报分析过程中保存部分特殊的冗余频繁项集、冗余多 层次关联规则和无趣多层次关联规则。【结果/结论】本文的研究可以发现涉恐数据中不同概念分层的关联规律。 [创新/局限] 文中提出的关联分析方法能够弥补普通的单层次关联规则挖掘在分析包含多层属性的涉恐数据中存 在的不足,为反恐预警和反恐决策提供更丰富、更科学、覆盖范围更广的参考。  相似文献   

12.
基于关系数据库的教学评价数据的关联规则挖掘   总被引:1,自引:0,他引:1  
於实 《科技通报》2012,28(4):99-101
频繁项集的挖掘是数据挖掘中的一个十分重要的组成部分。本文结合关系数据库的特殊性,利用标准SQL语言,提出适合于关系型数据库频繁项关联规则挖掘的算法,应用于教学评价数据的挖掘,得出一些潜在的关联信息,为教学管理提供决策。  相似文献   

13.
统计量化规则(SQ rule)在数据挖掘中拥有重要和有用的地位。尽管集中式挖掘SQ规则的算法已经存在,但是集中式算法不能简单应用到分布式环境中,尤其涉及到分布式环境中各方的私有信息保护的时候。考虑数据分布共享的多方,在不泄漏各自的私有信息的情况下,合作完成SQ规则的挖掘问题。该问题属于保护私有信息的数据挖掘(PPDM)研究领域的问题。基于3个PPDM的基本工具,包括安全求和、安全求平均和安全求频繁项集的集合等,提交2个算法,共同完成水平划分数据下的保护私有信息的SQ规则挖掘。其中,一个算法安全计算置信区间,该区间用来检验规则的重要性;另一个算法安全挖掘规则。最后,给出算法的正确性、安全性和复杂性分析。  相似文献   

14.
挖掘最大频繁项目集是数据挖掘领域的一个重要的研究内容。Apriori算法作为一种挖掘频繁项目集的基本算法,其缺点是产生大量的候选项目集,算法的代价很大。本文在基于FP-Tree的基础上提出了挖掘最大频繁项目集的新算法FP-GDMA。该算法采用自顶向下和自底向上相结合的搜索策略有效减少了生产候选项目集的数目,有效提高了挖掘最大频繁项目集的效率。并通过实验比较FP-GDMA与DMFIA算法。  相似文献   

15.
Apriori算法是关联规则挖掘中的经典算法。通过对Apriori算法的基本思想和性能的研究分析,提出了一种基于垂直事务列表的树形结构的挖掘算法,减少了候选频繁项集的数量,提高了挖掘算法的效率。实验结果表明新算法具有良好的性能。  相似文献   

16.
吉顺权  周毅 《现代情报》2015,35(6):114-121
在总结用户评论相关研究的基础上,提出关联规则理论在用户评论挖掘中的作用,包括可以用来挖掘产品的优劣势特征及其程度大小,以及挖掘影响产品整体评价的关键特征。提出了基于产品特征关联规则数据挖掘的企业竞争情报应用模型,包含确定用户评论情报源及其采集、数据预处理及其产品特征提取、数据结构化处理及其关联规则分析和产品优劣势特征及其关键特征的对比分析四个模块。最后通过实验论证了这一模型的价值。  相似文献   

17.
关联规则挖掘算法是数据挖掘领域的主要研究方向之一。对几种经典的关联规则挖掘算法进行了分析、探讨和比较,给出了一种基于支持矩阵的、不需要产生候选项目集的算法设计思想。算法为事务数据库中的每个项目设置二进制向量,利用逻辑与运算构造支持矩阵来挖掘频繁项目集,极大地节省了存储空间,提高了算法运行效率。  相似文献   

18.
张贞梅 《中国科技信息》2007,(13):257-259,261
关联规则的挖掘是数据挖掘的一个重要方面,本文介绍了关联规则挖掘的一般概念,探讨了数据仓库中关联规则的挖掘问题,提出一种基于矩阵的对L2进行改进的算法,并对其与Apriori算法进行了分析和比较。  相似文献   

19.
以新能源汽车产业专利数据为例,将专利被引用频次、同族数量作为衡量专利原始效用的主要指标,并通过两步骤的高效用关联规则挖掘算法,获得专利权人的高效用合作项集,以发现高价值的技术创新合作团队。实证表明,将专利价值的评价模型与高效用关联规则挖掘方法相结合,能够极大提升技术创新合作团队发现的召回率。此外,与传统关联规则挖掘方法相比,基于高效用关联规则获得的高价值团队在分布数量、分布类型等方面呈现明显优势。  相似文献   

20.
基于分布式科研项目数据的关联模式挖掘框架   总被引:1,自引:0,他引:1  
胡少华 《情报杂志》2012,31(8):156-160
储存于不同组织实施环节的科研项目数据中隐含了大量有用的关联模式信息,针对科研项目数据的分布性特点,提出了基于采集代理和中心节点的采集挖掘体系框架,一方面依据转换规则库、映射规 则库、元数据参照进行集成、转化、清洗和归一化处理,形成语义一致、面向不同主题的科研项目特征数据;另一方面建立特征属性定义表,利用多维关联规则实现对科研项目关联模式的挖掘分析.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号