首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 203 毫秒
1.
关联规则是数据挖掘中一个非常重要的任务,有许多针对于关联规则的挖掘算法,然而需要提高算法的有效性来处理现实世界中的数据集。基于聚类的关联规则挖掘算法法通过扫描数据库创建聚类表,将收集的事务记录放入聚类表中,通过局部聚类表的约束来产生频繁项集,不仅可以剪枝候选项集,降低数据扫描的时间,而且确保挖掘结果集的正确性。实验结果表明,基于聚类的关联规则挖掘算法比Apfiori算法有更高的执行效率。  相似文献   

2.
关联规则的挖掘分为两步,首先找出满足最小支持度要求的频繁项目集,然后根据频繁项目集生成满足最小置信度要求的关联规则集.目前对关联规则挖掘的研究主要集中在频繁项集的生成上,然而,作为整个关联规则挖掘的一部分,由频繁项集生成关联规则的算法也有待进一步研究和改进.本文首先对传统的集合操作进行了扩展,然后在扩展集合操作的基础上,提出了由已挖掘出的最大频繁项集生成关联规则的算法ARD-ES,并对算法的复杂度作了理论和实验上的分析.实验表明,ARD-ES算法随着事务数据库容量的增大,时间占用的攀升基本上是线性的,空间占用在某一定值上下波动.  相似文献   

3.
计算机软件蕴含大量工作信息,有效挖掘软件数据信息之间的内在关联是信息时代对软件应用的潜在要求。针对经典Apriori算法挖掘数据效率低、复杂度高的问题,提出一种改进Apriori算法用于挖掘计算机软件数据的关联规则。为计算机软件算法设置双重支持度阈值,即频繁项集与非频繁项集支持度阈值,快速获得强关联的频繁项集;在此基础上基于映射规则重构事务数据库,压缩数据库规模,减少算法的剪枝操作,降低计算机软件数据关联规则挖掘复杂度。以人力资源类计算机软件数据为例展开关联分析测试,结果显示,该算法挖掘的关联信息与人力资源实际管理情况一致,相比经典Apriori算法其效率有所提升。  相似文献   

4.
针对分类问题的支持向量机方法中存在对噪声和野值敏感的问题,提出了一种新的隶属度函数确定方法.研究和分析了目前针对这些问题所提出的模糊支持向量机方法,而在模糊支持向量机方法中,隶属度函数的设计是整个模糊算法的关键所在,文中主要对隶属度函数进行了深入地研究,在类中心向量方法的基础上,即在确定样本的隶属度时,对类中心距离方法进行改进,得到新的隶属度计算的方法,并从数值实验方面表明该方法的有效性和可行性.  相似文献   

5.
随着多数据库技术的快速发展,在多个数据库中获取有效信息显得尤为重要。现有技术都是在一个数据库中挖掘间接关联规则。采用投票率作为规则兴趣度量来提取全局间接关联规则,并在此基础上定义了相对支持度和方差来衡量间接规则的强度,以从多个数据库中挖掘有效的间接关联规则。最后通过实验验证了该方法的有效性。  相似文献   

6.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。提出了一种新的Apriori的改进算法,该算法在生成k(k>1)项频繁集时,不需要重新扫描数据库,只是在生成1项频集时,才需要扫描事务数据库,有效地减少了对事务数据库的读操作,在时间复杂度上较经典的Apriori算法有更加优越的性能。  相似文献   

7.
杨珍  耿秀丽 《教育技术导刊》2017,16(11):137-140
产品服务系统是一种高度集成及优化的“产品+服务”整体解决方案。质量功能展开作为常用的规划工具,传统方法依赖于设计师的知识经验,具有一定主观性,数据挖掘方法可以从已有的设计记录数据库中提取规则集来提高客观度。采用Apriori算法,获取客户需求和功能需求之间的关联规则,辅助PSS规划分析。由于设计数据库庞大,会降低数据挖掘及决策分析效率。在关联规则挖掘前,采用模糊C均值算法对客户群体进行聚类,以降低数据维度,提高挖掘效率。最后以烟机企业产品服务系统为例,验证了该方法的有效性和实用性。  相似文献   

8.
针对关联规则负增量更新的挖掘问题,提出了一种高效的关联规则负增量更新算法,即NIUA。该算法充分利用原数据库中已有的频繁项集、所有1-项集来生成最小非频繁项集;并采用选样等策略求出删减数据后的频繁项集。整个算法只需扫描删减后的事务数据库一遍,从而提高了关联规则的更新效率。  相似文献   

9.
关联规则挖掘是数据挖掘领域中的一个非常重要的研究内容,其主要目标就是发现数据库中一组对象之间某种关联。频繁项集挖掘是关联规则挖掘的关键步骤,它在很大程度上决定了关联规则挖掘的效率。介绍了Apriori算法及其算法改进。该改进算法对剪枝步进行了优化,提高了连接效率,并且不断减小数据库的规模,去掉无效事务,减少了每次扫描数据库所花费的时间,提高了算法效率。经过试验论证,性能比原有算法提高,具有一定的实用性。  相似文献   

10.
针对核模糊C-均值聚类算法中隶属度的计算特点,提出了一种改进的核模糊C-均值算法。改进后的算法是,在更新对象类的隶属度之前先判断对象是否可能属于该类。如果对象可能属于该类,则为其分配一个大于0的隶属度,否则直接将其隶属度置为0。针对不同测试数据集的实验结果表明,改进后的核模糊C 均值算法提高了聚类效果,是一种可行有效的算法。  相似文献   

11.
关联规则可在庞大的数据集中找出不同事务之间隐藏的关系,其中Apriori算法是关联规则分析中较为有效的办法。然而,Apriori算法产生候选项集的效率较低且扫描数据过于频繁,造成算法计算需要耗费较长时间。另外,初始定义的最小支持度与最小置信度也不足以过滤无用的关联规则。针对以上问题,利用概率理论与有效的参数设置,在原有Apriori算法基础上,提出一种基于概率事务压缩的关联规则改进算法。数值算例结果表明,新算法可在第二次迭代之后,大幅减少低效候选项集,从而提升经典Apriori算法效率。  相似文献   

12.
数据挖掘是从大量的数据中提取知识。数据挖掘的主要功能有关联、分类、预测、聚类和时序分析等。文章对关联规则和分类规则这两种挖掘模式的存储方法进行研究,提出在关系数据库系统中使用主-子表来存储关联规则和分类规则的方法,继而将这种存储方法应用在其它类型的模式上,形成一种统一的数据挖掘模式的存储方法。  相似文献   

13.
字符串比较是计算机信息处理的重要方法之一。针对现有关联规则挖掘算法不能记忆及利用历史挖掘成果的局限性,提出了将事务数据库转化为项目数据库,构造项目的支持事务标识符有序序列方法。为提高挖掘效率,减少串处理效率较低的负面影响,给出了双序列串比较算法,以及针对串比较的大项目频繁集发现方法。  相似文献   

14.
在FDM算法的基础上,提出了一种改进的并行关联规则挖掘算法FDM_DT,此算法利用DHP算法中的Hash表技术改进了2阶侯选项集的生成过程,并采用Apriori Tid算法中的Tid表技术对事务数据库中的事务数进行有效消减。因此,此算法在处理大规模数据时有较高的综合效率。  相似文献   

15.
发现最大频繁项目集在关联规则挖掘中有着重要意义。通过已发现的最大频繁项目集,可容易地发现频繁项目集。提出了一种基于事务树(T-tree)的最大频繁项目集挖掘算法MFIA(Maximum Frequent Itemsets Algorithm),其挖掘过程中只需对数据库扫描一次,从而提高了最大频繁项目集的挖掘效率。  相似文献   

16.
Web使用模式挖掘是从用户浏览网站的数据中抽取感兴趣的模式,理解用户的浏览兴趣行为,以便进一步改善网站结构或为用户提供个性化的服务。尽管Web日志挖掘是一些数据挖掘算法的应用,但不是简单地将数据挖掘算法修改为适用于新的数据类型,其中涉及许多处理工作。试从偏离网页的去除、使用者浏览路径相似程度的计算,对使用者浏览路径的模糊聚类的分析三个方面论述FC—MDE模糊聚类的Web用户模式挖掘。  相似文献   

17.
针对煤炭企业采用的基于关联规则的数据挖掘技术存在的不足,文章提出了一种基于时间聚类的加权关联规则挖掘算法,分析了关联规则的基本概念,简要介绍了传统Apriori算法原理,详细介绍了基于时间聚类的加权关联规则挖掘算法原理及实现.实际应用范例表明,与Apriori算法相比,基于时间聚类的加权关联规则挖掘算法具有较高的准确性.  相似文献   

18.
针对Apriori算法寻找频繁项集问题,提出了一种基于有向图的频繁集挖掘算法DGFM,该算法将事务数据库表示成二进制矩阵,利用有向图的思想,将频繁项的二进制位串作为有向图的权值,再将二进制矩阵用邻接表存储,通过搜索邻接表来生成频繁项集,最后试验证明该方法比Apriori算法具有更高的效率和性能.  相似文献   

19.
关联规则是数据挖掘领域的一个重要分支。随着大量数据的收集和存储,人们对于从数据库中挖掘关联规则越来越感兴趣,Apriori算法就是经典的关联挖掘算法。文章分析了Apriori的算法思想、算法描述及实际应用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号