首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
应用数据挖掘技术对高校就业数据进行了分析,介绍了就业数据预处理过程,并对处理好的数据应用Apriori算法进行关联挖掘,对实验结果进行了总结。  相似文献   

2.
提出基于云计算平台(以Hadoop为例)应用布尔矩阵Apriori算法进行大数据关联规则挖掘的MR_B_Apriori算法。将Hadoop平台与布尔矩阵Apriori算法相结合,利用MapReduce框架分块处理布尔矩阵,计算出分块数据的频度,合并融合得到大数据集的频繁项集。分析表明MR_B_Apriori算法能够适用于大数据的频繁项集挖掘。  相似文献   

3.
计算机软件蕴含大量工作信息,有效挖掘软件数据信息之间的内在关联是信息时代对软件应用的潜在要求。针对经典Apriori算法挖掘数据效率低、复杂度高的问题,提出一种改进Apriori算法用于挖掘计算机软件数据的关联规则。为计算机软件算法设置双重支持度阈值,即频繁项集与非频繁项集支持度阈值,快速获得强关联的频繁项集;在此基础上基于映射规则重构事务数据库,压缩数据库规模,减少算法的剪枝操作,降低计算机软件数据关联规则挖掘复杂度。以人力资源类计算机软件数据为例展开关联分析测试,结果显示,该算法挖掘的关联信息与人力资源实际管理情况一致,相比经典Apriori算法其效率有所提升。  相似文献   

4.
针对药品零售大数据信息,提出一种基于遗传模拟退火算法的关联规则挖掘改进算法。首先以遗传算法为主体,模拟退火算法作为其辅助,在遗传算法选择操作、交叉运算和变异运算中融入模拟退火算法,实现对算法的设计;然后运用Python语言实现了算法,并通过对药品零售大数据关联规则挖掘,发现药品零售大数据之间的关联,有效地量化了药品之间的相关程度;最后对改进算法进行有效性和可行性测试。仿真实验表明,相比遗传算法,该算法的挖掘速快,挖掘质量高,有效地提高品零售大数据关联规则挖掘的性能。  相似文献   

5.
对数据关联规则挖掘中最为消耗系统资源的步骤——搜寻频繁项集作了深入的描述,在对已有数据关联规则挖掘算法的分析基础上,提出了基于Fp—Growth算法的数据关联规则挖掘改进的Fp—Growth算法,开发了无锡交通高等职业技术学校的教务管理系统,并通过实验验证了改进的挖掘算法的有效性和优越性。  相似文献   

6.
针对FP-Growth算法在处理海量数据时需要耗费大量系统资源无法实现快速的挖掘出关联规则,提出基于Map-Reduce框架的FP-Growth算法.通过使用Map-Reduce计算框架实现FP-Growth算法对数据的并行处理,提高算法的执行效率.最后通过实验证明所提出的算法在处理海量数据方面具有较好的性能.  相似文献   

7.
在地质勘察的土工试验中产生大量的数据,迫切需要挖掘隐藏在这些数据间的大量有趣信息。而数据预处理技术的好坏直接影响数据挖掘的结果。现介绍一种在挖掘关联规则前的数据预处理技术,给出了相应算法,并通过实例说明了算法的执行过程。  相似文献   

8.
关联规则是数据挖掘中一个非常重要的任务,有许多针对于关联规则的挖掘算法,然而需要提高算法的有效性来处理现实世界中的数据集。基于聚类的关联规则挖掘算法法通过扫描数据库创建聚类表,将收集的事务记录放入聚类表中,通过局部聚类表的约束来产生频繁项集,不仅可以剪枝候选项集,降低数据扫描的时间,而且确保挖掘结果集的正确性。实验结果表明,基于聚类的关联规则挖掘算法比Apfiori算法有更高的执行效率。  相似文献   

9.
时态数据挖掘是数据挖掘中一个日益重要的研究课题,针对时态数据中的多维关系模型,提出了一种新的多维时态关联规则挖掘算法,给出了一个多维间时态关联规则的算法主要步骤,并给出了数值实验分析,这种多维时态关联规则可以用于商品销售、股票价格等问题的知识发现和短期的预决策。  相似文献   

10.
纯方位多传感器多目标数据关联属于NP-Hard难题,目前许多数据关联算法的研究成果大多集中在目标的跟踪阶段,而对于航迹起始阶段数据关联问题的研究相对较少.为此,本文提出一种基于Mean Shift和模糊C均值混合聚类的数据关联方法,将来自于不同传感器的方向测量线相交叉产生的候选点进行聚类,提取出最有可能源自真实目标的候选点,再对所提取的候选点应用逻辑法进行航迹起始.不同场景下的仿真实验和不同方法的性能比较结果证明了该方法的有效性.  相似文献   

11.
聚类算法是数据挖掘中用来发现数据分布和隐含模式的一项重要技术。通过分析研究数据仓库及数据挖掘中聚类算法的现状,对数据挖掘中常见的几种聚类算法的性能进行相互比较,并分析它们各自的优缺点,对数据挖掘中聚类算法的发展趋势作出展望。  相似文献   

12.
针对贵州项目网中非结构数据量大的特点和不易管理的问题,文章采用了基于遗传算法分类的方法和数据库管理的方法对贵州项目网进行了数据管理的重构设计并在贵州项目网建设中得以实践。结果表明基于遗传算法分类与数据库管理适用于整合管理大量的非结构数据。  相似文献   

13.
流数据是近年来关注比较多的一种数据形式,但由于它自身的特点,无法使用传统的算法对它进行聚类分析.数据挖掘是从大规模数据库中提取感兴趣的信息.聚类是数据挖掘的重要工具,它根据数据间的相似性将数据库分成多个类,每类中数据要求尽可能相似.针对流数据的特点,引入一种采用渔夫捕鱼策略的新的聚类算法.该算法采用动态多点随机投鱼网方法,并且根据捕鱼环境的不同采用不同的探测策略.流数据聚类的捕鱼算法是一种即时更新模型的在线聚类算法.  相似文献   

14.
l introductionThe progress of data-collection tCclmology, such as barcode scanners in commercial domains and sensors inscientific and industrial domains, gen~s huge amounts ofdata. It is not realistic to expect that all this data be carefullyanalyzed by human analysts and users. As poised out byPiatetsky-Shapiroll ], the huge size of real-world databasesystems creates both a need and an opportUnity for datamining and knowledge discovery teclmology.Discovering patterns in data seems tO be a k…  相似文献   

15.
针对贵州项目网中非结构数据量大的特点和不易管理的问题,文章采用了基于遗传算法分类的方法和数据库管理的方法对贵州项目网进行了数据管理的重构设计并在贵州项目网建设中得以实践。结果表明基于遗传算法分类与数据库管理适用于整合管理大量的非结构数据。  相似文献   

16.
分布式算法具有高度的适应性、可伸缩性、低性能损耗和容易连接等特性,可以作为挖掘关联规则的理想平台。分布式系统环境下实现高效分布式算法的方法。数据挖掘同关系数据库的关系,实现算法对数据库结构的要求,明确在实现中需要解决的几个核心问题。  相似文献   

17.
进行数据挖掘之前的原始数据经常是不完整或存在异常,针对这种情况,在众多数据预处理算法的基础之上,文中提出了一种基于遗传算法的数据预处理组合方法,能有效的利用各种方法的优点,提高了估计的精确度.通过实验证明,该方法优于其他各种单一方法.  相似文献   

18.
为了改善国内医疗云数据存储与共享中患者隐私泄露问题,加快互联网+医疗与医疗云建设,提出一种针对医疗大数据安全共享的隐私保护模型。模型将数据共享过程划分为3个阶段,明确各部分功能。采用一种适合医疗云数据加密场景的RS-Blowfish混合加密算法用于模型数据传输,在数据安全共享的同时兼具数字加密及身份认证功能。增添明文与密钥的Z形置换,改善初始密钥安全性,增添密钥认证,将传统的RSA算法、Blowfish算法和SHA-256算法结合为一个整体。实验结果表明, RS-Blowfish混合加密算法在增强Blowfish安全性的同时,加密速度较3DES快30%,较AES快10%。  相似文献   

19.
目前,已经有很多针对数据挖掘更新算法的研究,但大部分的更新算法都只是考虑事务数据库增量更新的情况.实际上,事务数据库数据还存在数据删减的更新问题,为了解决这类问题,提出了一种基于闭合序列模式的更新算法DeCloSpan,该算法对已有的挖掘结果直接进行删减更新,避免了重复挖掘.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号