共查询到20条相似文献,搜索用时 515 毫秒
1.
传统的关联规则挖掘技术过于依赖数据之间的关联属性,造成挖掘算法在高冗余知识空间关联规则不明显或者较弱的情况下挖掘耗时。本文提出一种应用与高冗余知识空间的优化数据挖掘算法。该算法首先找出最大频繁项集和频繁1-项集进行区域分类,然后利用已有频繁项集找出所有的其它频繁项集,去除冗余关联环境,节省了计算频繁项集的时间,节约了存储空间,使算法的效率得到提高。仿真实验结果证明了改进算法的可行性和有效性。 相似文献
2.
基于Web的数据挖掘技术 总被引:1,自引:0,他引:1
Web数据挖掘有很多研究热点,其中关联规则挖掘是Web数据挖掘领域研究的一个重要方面.本文首先对数据挖掘、Web数据挖掘和Web数据预处理等相关知识进行了阐述;然后研究了关联规则基本理论及关联规则经典算法;最后为了解决现实数据库中每个项目的分配不均匀性和重要性差异,重点研究了加权关联规则挖掘算法. 相似文献
3.
4.
5.
在现有的网格和数据挖掘技术基础上,研究OGSA面向服务的体系结构,建立了网格平台下的分布式数据挖掘系统模型。基于该模型。对经典关联规则算法FP—tree算法作了改进,提出分布式频繁模式挖掘算法,并对该模型和算法进行了分析、测试、和评估。 相似文献
6.
通过对各届毕业生生源等特征资料、高考的成绩数据、以及大学各门课的成绩挖掘,提供了一个在教育领域进行合理挖掘的模式。研究了如何把关系数据库的关联规则问题转化为单维、布尔关联规则问题,把关联规则挖掘中的经典算法Apriori算法在实例中进行了具体应用。 相似文献
7.
关联规则挖掘是数据挖掘领域中的一个非常重要的研究内容,其主要目标就是发现数据库中一组对象之间某种关联。频繁项集挖掘是关联规则挖掘的关键步骤,它在很大程度上决定了关联规则挖掘的效率。介绍了Apriori算法及其算法改进。该改进算法对剪枝步进行了优化,提高了连接效率,并且不断减小数据库的规模,去掉无效事务,减少了每次扫描数据库所花费的时间,提高了算法效率。经过试验论证,性能比原有算法提高,具有一定的实用性。 相似文献
8.
9.
关联规则研究目的是从大型数据集中发现隐藏的、属性间存在的有趣的关联或相关关系。当挖掘的数据不断更新时,如何高效即时的获得所需的结果,设计高效的算法来更新、维护和管理已挖掘出来的关联规则。该文提出了一种高效的增量更新算法,算法通过实例进行分析比较,证明了该算法有效的提高了挖掘的效率。 相似文献
10.
11.
【目的/意义】为了发现更全面、更具有普适性的反恐情报信息,本文在单层次关联规则挖掘的基础上研究
反恐情报的多层次关联规则挖掘方法。【方法/过程】根据反恐情报的数据特征提出统一最小支持度和多单项最小
支持度参数并用的方式筛选多层次涉恐特征频繁项集,在情报分析过程中保存部分特殊的冗余频繁项集、冗余多
层次关联规则和无趣多层次关联规则。【结果/结论】本文的研究可以发现涉恐数据中不同概念分层的关联规律。
[创新/局限] 文中提出的关联分析方法能够弥补普通的单层次关联规则挖掘在分析包含多层属性的涉恐数据中存
在的不足,为反恐预警和反恐决策提供更丰富、更科学、覆盖范围更广的参考。 相似文献
12.
基于关系数据库的教学评价数据的关联规则挖掘 总被引:1,自引:0,他引:1
频繁项集的挖掘是数据挖掘中的一个十分重要的组成部分。本文结合关系数据库的特殊性,利用标准SQL语言,提出适合于关系型数据库频繁项关联规则挖掘的算法,应用于教学评价数据的挖掘,得出一些潜在的关联信息,为教学管理提供决策。 相似文献
13.
统计量化规则(SQ rule)在数据挖掘中拥有重要和有用的地位。尽管集中式挖掘SQ规则的算法已经存在,但是集中式算法不能简单应用到分布式环境中,尤其涉及到分布式环境中各方的私有信息保护的时候。考虑数据分布共享的多方,在不泄漏各自的私有信息的情况下,合作完成SQ规则的挖掘问题。该问题属于保护私有信息的数据挖掘(PPDM)研究领域的问题。基于3个PPDM的基本工具,包括安全求和、安全求平均和安全求频繁项集的集合等,提交2个算法,共同完成水平划分数据下的保护私有信息的SQ规则挖掘。其中,一个算法安全计算置信区间,该区间用来检验规则的重要性;另一个算法安全挖掘规则。最后,给出算法的正确性、安全性和复杂性分析。 相似文献
14.
15.
Apriori算法是关联规则挖掘中的经典算法。通过对Apriori算法的基本思想和性能的研究分析,提出了一种基于垂直事务列表的树形结构的挖掘算法,减少了候选频繁项集的数量,提高了挖掘算法的效率。实验结果表明新算法具有良好的性能。 相似文献
16.
在总结用户评论相关研究的基础上,提出关联规则理论在用户评论挖掘中的作用,包括可以用来挖掘产品的优劣势特征及其程度大小,以及挖掘影响产品整体评价的关键特征。提出了基于产品特征关联规则数据挖掘的企业竞争情报应用模型,包含确定用户评论情报源及其采集、数据预处理及其产品特征提取、数据结构化处理及其关联规则分析和产品优劣势特征及其关键特征的对比分析四个模块。最后通过实验论证了这一模型的价值。 相似文献
17.
关联规则挖掘算法是数据挖掘领域的主要研究方向之一。对几种经典的关联规则挖掘算法进行了分析、探讨和比较,给出了一种基于支持矩阵的、不需要产生候选项目集的算法设计思想。算法为事务数据库中的每个项目设置二进制向量,利用逻辑与运算构造支持矩阵来挖掘频繁项目集,极大地节省了存储空间,提高了算法运行效率。 相似文献
18.
关联规则的挖掘是数据挖掘的一个重要方面,本文介绍了关联规则挖掘的一般概念,探讨了数据仓库中关联规则的挖掘问题,提出一种基于矩阵的对L2进行改进的算法,并对其与Apriori算法进行了分析和比较。 相似文献
19.
20.
基于分布式科研项目数据的关联模式挖掘框架 总被引:1,自引:0,他引:1
储存于不同组织实施环节的科研项目数据中隐含了大量有用的关联模式信息,针对科研项目数据的分布性特点,提出了基于采集代理和中心节点的采集挖掘体系框架,一方面依据转换规则库、映射规 则库、元数据参照进行集成、转化、清洗和归一化处理,形成语义一致、面向不同主题的科研项目特征数据;另一方面建立特征属性定义表,利用多维关联规则实现对科研项目关联模式的挖掘分析. 相似文献