共查询到20条相似文献,搜索用时 15 毫秒
1.
传统的关联规则挖掘技术过于依赖数据之间的关联属性,造成挖掘算法在高冗余知识空间关联规则不明显或者较弱的情况下挖掘耗时。本文提出一种应用与高冗余知识空间的优化数据挖掘算法。该算法首先找出最大频繁项集和频繁1-项集进行区域分类,然后利用已有频繁项集找出所有的其它频繁项集,去除冗余关联环境,节省了计算频繁项集的时间,节约了存储空间,使算法的效率得到提高。仿真实验结果证明了改进算法的可行性和有效性。 相似文献
2.
在挖掘关联规则的过程中,关键步骤是产生频繁项集。文中利用逻辑与运算并建立频繁项集支持矩阵,提出一种有效的频繁项集挖掘算法—LA。算法利用逻辑与运算挖掘频繁项集,不产生候选项集,且只需扫描数据库一次,所以此算法是非常有效的。 相似文献
3.
在挖掘关联规则的过程中,关键步骤是产生频繁项集。文中利用逻辑与运算并建立频繁项集支持矩阵,提出一种有效的频繁项集挖掘算法-LA。算法利用逻辑与运算挖掘频繁项集,不产生候选项集,且只需扫描数据库一次,所以此算法是非常有效的。 相似文献
4.
Apriori算法是关联规则挖掘中的经典算法。在Apriori算法中,使用频繁项集的先验知识,逐层搜索的迭代方法,通过扫描数据库,累积每个项的计数,并收集满足最小支持度的项,找每个Lk都需要扫描一次数据库。算法的效率随着数据量的增大,频繁项集的增多,算法的效率就非常的低,本文通过对Apriori算法分析,应用散列、事务压缩、划分、抽样等方法,最大可能的减少数据库扫描的次数,快速发现频繁项集,提高Apriori算法的效率。 相似文献
5.
本文借助ARIZ思想深入研究了关联规则挖掘模式,综合介绍了关联规则的理论基础,进一步明确了项、项集、候选项集、频繁项集、支持度、置信度这些重要知识点,对关联规则进行了多角度的分类,研究分析了关联规则挖掘的经典算法,并对关联规则的评价标准进行了创新研究,引入了主观兴趣度和客观相关性分析,为后续研究和改进关联规则的算法提供了理论基础。 相似文献
6.
对大数据的频繁项集挖掘是关联规则挖掘的关键步骤,通过有效的频繁项挖掘提高大数据量数据库的访问效率。传统方法中对大数据的频繁项集挖掘采用FP-Growth的粗糙集挖掘算法,扩展性和容错性不好。提出一种基于贝叶斯粗糙集的大数据频繁项挖掘技术,引入后缀项表的概念,通过后缀项表的构建,保留频繁项集的完整信息。构建FP-Tree,生成闭频繁项集,计算样本的密度,并抽取高密度区域的点集作为聚类中心集合,进行后缀项表的构造,按支持度分成若干集合,对各约简集内的属性集合进行融合,用变精度粗糙集的贝叶斯粗糙进行数据挖掘算法改进,仿真结果表明,算法不受可变参数的影响,鲁棒性较高,数据挖掘的准确度较高,运行时间较短。算法将在人工智能和数据挖掘领域具有更广的应用前景。 相似文献
7.
Apriori算法是关联规则挖掘中的经典算法。通过对Apriori算法的基本思想和性能的研究分析,提出了一种基于垂直事务列表的树形结构的挖掘算法,减少了候选频繁项集的数量,提高了挖掘算法的效率。实验结果表明新算法具有良好的性能。 相似文献
8.
9.
【目的/意义】为了发现更全面、更具有普适性的反恐情报信息,本文在单层次关联规则挖掘的基础上研究
反恐情报的多层次关联规则挖掘方法。【方法/过程】根据反恐情报的数据特征提出统一最小支持度和多单项最小
支持度参数并用的方式筛选多层次涉恐特征频繁项集,在情报分析过程中保存部分特殊的冗余频繁项集、冗余多
层次关联规则和无趣多层次关联规则。【结果/结论】本文的研究可以发现涉恐数据中不同概念分层的关联规律。
[创新/局限] 文中提出的关联分析方法能够弥补普通的单层次关联规则挖掘在分析包含多层属性的涉恐数据中存
在的不足,为反恐预警和反恐决策提供更丰富、更科学、覆盖范围更广的参考。 相似文献
10.
经过分析关联规则中Apriori算法存在的不足,为减少对事务数据库的扫描次数,缩减产生频繁项集的时间,列出两种基于哈希表的计算项集支持计数的方法以及利用哈希表来进行项集的地址定位的方法,使得生成频繁项集的效率有所提高。 相似文献
11.
为了提高用户需求数据挖掘的时效性及准确性,提出基于径向基函数神经网络的数据关联挖掘算法。在对数据频繁项集约束性关联规则研究的条件下,通过约简计算,得到满足约束条件的候选数据集,并对用户需求数据频繁项集更新;利用径向基函数神经网络对候选数据集进行训练优化,通过上界剪枝法,获取用户需求数据,并实现其实时挖掘。实验结果表明,所提数据挖掘算法执行效率受数据规模变化的影响较小,挖掘效率更高,扩展性更好。 相似文献
12.
设计了一种模糊关联规则挖掘算法——F-Apriori算法.在设计了支持度和置信度计算方法的基础上,该算法采用改进的Apriorl算法挖掘数值属性的关联规则.实验结果表明,算法在规则生成方面显示了良好的性能. 相似文献
13.
由于其内在的计算复杂性,在密集型数据序列数据库中挖掘全部频繁项集往往非常困难,解决方案之一是挖掘最大频繁序列。传统的序列模式方法对满足最小支持度阈值的序列同等对待,但在真实数据库中不同的序列往往具有不同的重要程度。为解决上述问题,提出了一种挖掘加权最大频繁序列的新算法。该算法利用频繁项目出现的频率来计算频繁序列的权重,给出了频繁加权序列的定义,该定义的引入不仅可以找出较为重要的最大频繁序列,而且可以使挖掘结果同样具有反单调性,从能够加速剪枝,提高算法效率。实验结果表明,加权最大频繁序列算法是有效的。 相似文献
14.
《科技通报》2015,(10)
对信息源位置的隐私保护算法设计是保证网络用户通信安全基础,传统的隐私保护算法采用群签名跟踪算法,存储和搜索代价大,且具有可追踪的特点,保护性能不好。提出一种基于同态映射联合追踪的信息源位置隐私保护算法。以车用自组网络为例,进行信息源位置隐私保护系统初始化构建,在安全和隐私增强的情况下兼顾效率,采用批验证和撤销预处理减少验证和撤销检测的计算量,通过同态映射联合追踪,得到隐私保护的相对差异,调节平均偏差和方差,发送联合追踪请求,进行同态映射操作,提高隐私保护性能。仿真结果得出,算法具有较好的隐私保护性能,新算法在隐私保护水平和数据实用性方面较传统算法有明显改善。 相似文献
15.
16.
17.
在现有的网格和数据挖掘技术基础上,研究OGSA面向服务的体系结构,建立了网格平台下的分布式数据挖掘系统模型。基于该模型。对经典关联规则算法FP—tree算法作了改进,提出分布式频繁模式挖掘算法,并对该模型和算法进行了分析、测试、和评估。 相似文献
18.
19.
关联规则是数据挖掘的重要研究方向之一,Apriori算法是利用关联规则进行数据挖掘中的一个最经典的算法。通过对Apriori算法进行研究分析,发现该算法具有产生大量候选项集和多次扫描数据库的缺点。提出了一种基于矩阵按位存储的改进型Apriori算法,该算法将数据库中的数据读入内存,用矩阵按位存储数据,使用按位运算计算项集的支持数,提高了支持数计数的效率,从而提高了关联规则挖掘的速度和效率。 相似文献
20.
关联规则挖掘算法为了发现事先未知的关联规则,需要用高效的方法计算出数据库中的大项目集。影响数据挖掘效率的两个因素,一个是数据库大小,另一个是算法的效率。本文算法通过将数据库进行高度压缩,使数据库中的数据量大大减少,同时算法采用逻辑运算方法计算项集的支持数,计算效率较高。 相似文献