共查询到20条相似文献,搜索用时 31 毫秒
1.
聚类算法一直备受研究者青睐。随着信息技术和数据技术的发展,数据的种类和数量急剧增长,云计算平台Hadoop成为这些数据存储和处理的新平台,基于云计算平台Hadoop的聚类算法逐渐成为热门。针对数据挖掘中的聚类问题,依托云计算模式及Hadoop平台,研究了K-means算法,有效改变了现有算法的局限性。 相似文献
2.
介绍云计算的概念及应用,探讨传统数据挖掘方法——分类和聚集方法的基本原理、特点、优缺点及应用范围。根据云计算的并行分布式计算特点,提出与之适应的数据处理方法。借助Google云计算中的分布式数据处理平台,评价云计算下复杂数据形式的数据挖掘方法。 相似文献
3.
4.
5.
张凯萍 《赤峰学院学报(自然科学版)》2018,(8)
随着互联网、云计算和人工智能等高科技信息技术的飞速发展,人们需要处理的数据量也成为一个天文数字,如何有效地处理这些数据并从中获取有价值的信息已经成为科研、企业、经济市场等领域重点关注的问题,其中的关键便是数据挖掘.本文针对数据挖掘的定义、数据挖掘相关技术的应用以及随之而来的隐私保密问题进行了分析探讨,以供参考. 相似文献
6.
下一代互联网的大数据挖掘平台是一套以监测分析为手段,同时面向业务与应用和数据挖掘的综合平台.平台按三层架构进行建设,分别是采集层、存储和处理层、应用层,使用云计算和云存储,最大程度排除设备故障,优化网络,提升用户体验,挖掘各种业务海量数据带来的最大价值,帮助运营商等解决网络面临的最大问题. 相似文献
7.
在云计算环境下,对高级持续威胁数据的准确挖掘可以提高云计算网络的安全防御能力.高级持续威胁数据具有极值扰动非线性特征,传统的线性处理方法难以实现对这类数据的准确挖掘.提出一种基于极值扰动非线性特征提取的云计算环境下的高级持续威胁数据挖掘仿真模型,对系统载荷运行情况进行评估,得到云计算下的动态任务调配,分析高级持续威胁数据的极值扰动非线性特性,计算高级持续威胁数据的稳态概率,得到极值扰动非线性特征,对非线性特征进行脉冲响应不变周期标记.实现了高级持续威胁数据极值扰动非线性特征的挖掘,构建数据挖掘模型.仿真实验表明,算法对持续威胁数据的正确检测概率在95%以上,数据挖掘性能优越,在云计算环境下的高级持续威胁数据的检测挖掘等领域应用价值较高,为网络安全系统构建等奠定基础. 相似文献
8.
随着数据挖掘逐渐被应用到金融、娱乐、商业和医疗等多个行业,近年来涌现出各种用于处理海量数据的数据处理引擎,如MapReduce、Spark等。为了使高校实验室更深入地进行数据挖掘领域的理论研究,简要阐述分析了Spark技术及HDFS的概念与基本原理,详细介绍了基于Spark的云计算平台配置方法和实现过程,并对平台搭建过程中遇到的问题进行总结。实验结果证明,该平台能够有效完成分布式数据处理任务。 相似文献
9.
当前云计算己成为IT研究的热点问题之一,云计算是为应对企业对数据中心的处理能力要求不断提高而出现的。为实现计算资源的高利用率,企业需要构建自己的基于虚拟化技术的私有云平台。虚拟化技术、数据存储以及资源管理技术是构建云平台所需的关键技术。CloudStack是一个开源的IaaS云平台,通过对其架构进行分析,可以更好地理解云计算。 相似文献
10.
11.
李春华 《职教通讯(江苏技术师范学院学报)》2014,(26)
以建设智慧校园为契机,在满足学校安全需求的前提下,介绍了智能平安校园平台建设的实现过程。智能平安校园平台需借助先进的物联网、云计算、数据挖掘和网络通信等技术,在智慧校园统一的架构和统一的数据标准下建设。所谓“智能”的本质是大数据的智慧应用。 相似文献
12.
随着云计算、移动计算等互联网技术的快速发展,海量数据分析已成为企业战略决策、营销推广的基础,海量数据挖掘愈显重要。传统的K均值算法作为一种硬聚类算法存在诸多问题,例如数据划分武断、准确率较低等。引入模糊数学思想,提出了一种模糊K均值算法,基于隶属度关系对数据进行了有效的聚类分析,以提高数据挖掘的准确度。 相似文献
13.
14.
云计算的大数据分析平台构建分析 总被引:1,自引:0,他引:1
《赤峰学院学报(自然科学版)》2020,(3)
根据目前大数据在各个领域使用的特点进行分析,分析大数据在发展中面临的挑战,主要针对云计算中大数据平台的构建进行分析.构建云计算大数据平台,包括大数据整个架构、分析平台软件架构、平台的网络架构、统一分析大数据平台构建方案.为云计算大数据平台的市场竞争提供参考,这里将会针对云计算建立统一大数据平台. 相似文献
15.
提出了云计算环境下电子政务统一信息平台的建设思路,论述了利用云计算的优势解决电子政务信息共享的问题.给出云计算环境下电子政务统一信息平台的总体架构,通过虚拟化技术、SOA技术实现电子政务的资源子云、服务子云和数据子云等,逐步建设云时代下的新一代的电子政务信息系统. 相似文献
16.
《赤峰学院学报(自然科学版)》2020,(2)
针对数据挖掘实践课程现状和实际教学效果,结合数据挖掘实践课程特点,在分析总结多种数据挖掘工具的基础上,设计了一种基于Hadoop的数据挖掘实践平台.架构在分布式计算平台Hadoop上的数据挖掘实践平台,克服了传统数据挖掘工具的种种问题,其能够支持数据挖掘的标准流程,处理TB级的海量数据用于实践挖掘,为数据挖掘基础实践提供了丰富的数据挖掘算法用于建模.同时,基于Hadoop的数据挖掘实践平台提供了灵活多样的应用开发接口,能够支持第三方软件商集成开发,快速构建大型海量数据挖掘的应用系统,完成综合数据挖掘应用的二次开发.基于Hadoop的数据挖掘实践平台,为数据挖掘实践与科研提供了海量数据处理能力的数据挖掘平台,激励学生以竞赛模式学习和完成数据挖掘实践,从而促进了学生创新实践能力的培养. 相似文献
17.
曾春先 《重庆职业技术学院学报》2014,(5):148-150
可视化数据挖掘技术可以强有力地帮助企业作决策,已引起学术界和产业界越来越多的关注,本文进一步描述了可视化数据挖掘技术的概念.剖析了可视化数据挖掘技术,主要包括三个相关数据挖掘方面的可视化技术:数据、数据挖掘过程以及数据挖掘结果,以供参考. 相似文献
18.
基于云计算处理的物流网总体逻辑架构可以从数据存储、物联网、存储应用3个方面描述.将云计算的优势与物流的特点结合起来,形成智能物流综合管理平台系统.开发和建设现代化的公共物流信息平台,是物流信息化的首要任务,而基于云计算的云物流将是一个很好的解决方法和途径.实现定制化的云应用和公共信息集中管理模式,形成统一的物流链数据服务中心.各企业根据权限对其进行操作,可提升企业之间的业务协作,完成与多个合作伙伴的信息交流,进而实现统一平台下的业务协作提升整个物流链的物流服务水平和综合竞争力. 相似文献
19.
在云计算背景下,海量数据信息相互影响,对原本的关联规则形成冗余干扰,导致当前以线性思维为主导的挖掘平台受到冗余干扰的影响,挖掘效率低下。为此,在分析传统方法弊端的基础上,提出了基于分布式思维的数据挖掘平台设计方法。为了解决冗余干扰问题,设计了一种冗余消除算法,以计算区域之间的相似度,形成分布式挖掘关联。试验结果证明,这种分布式数据挖掘平台可达到数据搜索简单、快速,且降低成本的目的。 相似文献
20.
近年来,随着Web2.0的兴起,互联网信息更加丰富,数据规模日益增加,传统数据挖掘技术难以满足需要.云计算为解决这一问题提出了一种新方法.本文首先对开源的云计算技术Hadoop进行介绍,然后,对分布式进行了设计.本文将聚类过程分为三个步骤,分别对TF-IDF关键词提取、LDA 模型训练和K -means 聚类过程进行MapReduce 的实现,并使用公共微博数据集进行了聚类实验,并与传统聚类方法进行对比,结果表明,本文所使用LDA 建模的分布式算法对中文微博数据聚类效果较好. 相似文献