首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 956 毫秒
1.
将形式概念分析技术应用于Web使用日志文件的挖掘,提出基于多值属性形式上下文,利用频繁闭项集挖掘Web使用日志生成关联规则的增量挖掘算法。与经典挖掘方法比较,减少了对Web使用日志的扫描次数,提高了挖掘效率,同时还可以进行增量挖掘,满足了实时页面推荐的需要。  相似文献   

2.
介绍电子商务和Web数据挖掘的概念,并介绍Web使用挖掘中应用最多的技术——Web日志挖掘.重点阐述了日志挖掘算法——关联规则的有关知识,以及改进的频繁项目集生成算法Apriori和强关联规则生成算法,并结合实例进行了分析研究.  相似文献   

3.
介绍了Web日志挖掘的模型,分析了使用关联规则挖掘Web日志时遇到的规则数量大且存在冗余等问题,提出了基于频繁闭项集的挖掘办法来减少规则数量.同时引入最小关联规则的概念,从而避免了冗余规则的产生.最后用实验验证了算法的有效性,并以周口师范学院校园网为例,对该网站日志数据进行分析,得到了有价值的规则,并对该网站提出了相应的建议和意见.  相似文献   

4.
针对传统关联规则 Apriori 算法难以适应大数据的问题,为提高可信计算平台日志数据分析效率, 提出了一种基于Hadoop的可信计算平台日志分析模型。构建了日志分析模型总体框架,对非结构化原始日志数据进行垂直划分,采用分布式文件存储系统,结合MapReduce编程模式给出一种分布式Apriori并行垂直算法。通过日志挖掘建立用户行为关联规则库,并采用规则匹配实现对用户异常行为的检测。理论分析和实验数据证明,该模型在大数据环境下能够有效提高日志分析效率。  相似文献   

5.
针对传统入侵检测系统存在的问题,提出将数据挖掘技术应用到入侵检测系统中,分析了常用于入侵检测技术中的数据挖掘方法,并将关联分析与分类分析应用到基于主机日志的异常检测中,对数据挖掘算法和如何将数据挖掘算法应用到入侵检测系统进行了研究.实现了一个基于主机日志数据的挖掘模块,通过对IIS日志文件的挖掘,生成访问异常关联规则,为入侵检测系统服务.  相似文献   

6.
将项目权值引入传统关联规则挖掘中是在项目属性上的扩展。本文分析项目权值对加权关联规则挖掘的影响,并对加权关联规则现有的算法进行总结,同时比较各算法的优缺点。最后对加权关联规则的未来研究发展方向进行探讨。  相似文献   

7.
潘磊 《教育技术导刊》2009,19(10):152-155
为了提高电力系统中故障预测效率及便捷性,提出一种基于FP-Growth算法的电力系统故障预测方法,无需先验知识及人工标注,便可从海量历史日志数据中快速提取出故障信息模式,并基于实时日志数据对未来可能发送的系统故障进行预测。该方法首先根据电力系统不同类型的日志特征对原始数据进行预处理,然后基于FP-Growth算法挖掘日志中与故障事件相关的关联规则,并使用关联规则进行故障匹配,从而达到预测效果。算法经过真实电力系统日志数据集测试,结果表明该故障预测方法平均准确率为89.5%,平均召回率为79.8%,且执行效率较高,节省了业务人员50%以上的时间。  相似文献   

8.
本文在对数据挖掘相关技术、关联规则挖掘算法进行深入研究的基础上,归纳总结了基于粗糙集理论的关联规则挖掘模型和属性约简算法,并将其成功应用于大学生评价中,为社会选拔人才提供有价值的参考。  相似文献   

9.
Web日志挖掘是对用户与Web服务器在交互时产生的数据,采用数据挖掘技术发现隐含的规律性知识。首先对Web日志挖掘进行了概述,重点研究了关联规则算法中的Apriori算法,并对Apriori算法进行了改进,最后给出具体实例。  相似文献   

10.
针对煤炭企业采用的基于关联规则的数据挖掘技术存在的不足,文章提出了一种基于时间聚类的加权关联规则挖掘算法,分析了关联规则的基本概念,简要介绍了传统Apriori算法原理,详细介绍了基于时间聚类的加权关联规则挖掘算法原理及实现.实际应用范例表明,与Apriori算法相比,基于时间聚类的加权关联规则挖掘算法具有较高的准确性.  相似文献   

11.
关联规则是数据挖掘领域的一个重要分支。随着大量数据的收集和存储,人们对于从数据库中挖掘关联规则越来越感兴趣,Apriori算法就是经典的关联挖掘算法。文章分析了Apriori的算法思想、算法描述及实际应用。  相似文献   

12.
本文主要分析了数据挖掘的相关概念及其过程,介绍了关联规则的提取方法、遗传算法的基本要素、操作技术、基本步骤等。最后结合相关实例提出了在遗传算法当中进行关联规则的数据挖掘方法。  相似文献   

13.
关联规则是数据挖掘中一个非常重要的任务,有许多针对于关联规则的挖掘算法,然而需要提高算法的有效性来处理现实世界中的数据集。基于聚类的关联规则挖掘算法法通过扫描数据库创建聚类表,将收集的事务记录放入聚类表中,通过局部聚类表的约束来产生频繁项集,不仅可以剪枝候选项集,降低数据扫描的时间,而且确保挖掘结果集的正确性。实验结果表明,基于聚类的关联规则挖掘算法比Apfiori算法有更高的执行效率。  相似文献   

14.
关联规则是数据挖掘的重要内容之一.Apriori算法是关联规则挖掘的经典算法,本文对Apriori算法和改进后的FP-Growth算法进行了深入的研究,并以实际的案例进行了算法解析,通过对两种算法的比较与分析,选择FP-Growth算法应用到毕业生信息管理系统中,从大量的毕业生信息出发,找出就业信息与教育信息之间的关系,从而为决策者提供指导或数据支持,指导目前的专业建设、课程改革,促进学校的教学改革,提高人才培养质量.  相似文献   

15.
根据数据挖掘中关联规则的性质以及高校成绩管理数据库的自身特点,在经典关联规则算法Apriori算法的基础上提出了一种改进的算法A 算法,并利用该算法对学生成绩管理数据库进行了关联规则挖掘,得到了隐含在数据库中的有用信息。  相似文献   

16.
文章在研究多维关联规则挖掘算法的基础上,提出了一种适合关系型弱点数据库的高效的多维关联规则挖掘算法AprioriTidList +.该算法以Apriori算法思想为核心,通过对单维的层次算法AprioriTidList进行改造得到.通过与多种算法的比较、分析,对AprioriTidList+算法的优点进行了介绍.  相似文献   

17.
为明确中医治疗抑郁症用药规律,融合Apriori优化算法与Relim算法,采用数据挖掘技术进行分析。针对传统Apriori算法频繁扫描数据库从而生成大量候选项集的缺点,改变其原有剪枝方式以减少扫描次数。将改进后的Apriori算法与无需产生候选项集的Relim算法就中医治疗抑郁症的方剂数据进行关联规则分析,并绘制两个算法时间效率图。结果发现,两种算法在挖掘药物频繁项集与关联规则的结果基本相同,通过分析发现,中医常以疏肝、理气、补肾、滋阴等药物为主治疗抑郁症。改进后的Apriori算法可降低数据库扫描次数,较传统Apriori算法运行效率有所提高,Relim算法在空间利用率和时间执行率上均略优于改进后的Apriori算法。两种算法挖掘结果体现出中医治疗抑郁症注重疏肝理气、补肾滋阴、调理气血等特点。基于关联规则的方法可作为中医用药规律分析的重要工具。  相似文献   

18.
数据挖掘技术综述   总被引:1,自引:0,他引:1  
在对数据仓库与数据挖掘的概念及数据挖掘的功用与分类进行介绍的基础上,阐述了串行关联规则算法和并行关联算法的目标与内容,详细分析了Apriori算法、神经网络、遗传算法等数据挖掘算法。  相似文献   

19.
提出了一种分类规则的蚁群挖掘算法.算法首先对所有的连续属性值离散化,得到相应的离散属性,然后让各只蚂蚁按照某种策略选择相关属性,对所选属性再选择理想的属性值,循环地构造单个规则,接着更新训练集,最终形成各类规则集.最后用新规则约简算法进行约简操作.对两个公用数据的实验及其与Ant-Miner和C4.5的对比表明,算法能够发现更好的分类规则.实验同时表明该算法是有效的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号