首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
张瑞 《人天科学研究》2010,(10):164-165
ETL即数据抽取、转换和加载,是构建数据仓库和数据挖掘的重要组成部分。首先探讨了ETL体系结构,然后,通过数据抽取、数据转换和数据加载3方面来全面阐述ETL的核心内容,并讨论分析了ETL工具实现的关键技术,为数据挖掘和数据仓库的搭建提供了强有力的支持。  相似文献   

2.
本文简单介绍了决策树概念及C5.0算法原理,利用数据挖掘方法分析了移动客户的消费行为,搭建了一个基于内容营销目标客户的预测模型,提供了模型的分析方法及实例。  相似文献   

3.
李翔坤 《科技风》2022,(10):71-73
面对移动互联网中庞大的数据量,如何进行挖掘和可视化的分析是当前大数据研究的一个热点.本文搭建了一个互联网数据挖掘与分析平台,首先采用基于Scrapy框架搭建的爬虫系统从互联网络爬取了大量新闻数据与招聘数据,通过Sphinx和CoreSeek经过google-diff-match-patch算法去重,最后利用R语言对这些...  相似文献   

4.
以Hadoop为代表的分布式系统,正在逐渐成为大数据挖掘系统必要组成部分。因此,就是在Hadoop分布式系统上完成数据挖掘任务的一次实践。主要任务是使用Hadoop搭建分布式集群环境,并在该环境上部署数据挖掘任务。研究Hadoop系统架构,对其分布式文件系统HDFS和MapReduce并行编程模型的原理和实现进行深入理解。系统掌握数据挖掘过程,将传统的数据挖掘算法使用MapReduce编程实现,并针对Hadoop平台的数据挖掘算法的执行情况进行研究,主要分析其执行效率和可扩展性。选择数据挖掘中的数据聚类任务作为代表,并选择K-means聚类算法做深入研究,掌握其原理并编写其MapReduce版本,在Hadoop平台上测试并验证其效果。通过不同集群规模和不同数据规模的对比试验得出,使用Hadoop分布式系统进行数据挖掘任务具有良好地加速比和效率,计算能力的扩展性能分析也显示了其具有较大的潜力。  相似文献   

5.
数据仓库是构建客户关系管理系统的基础平台,针对航空领域业务数据特点构建数据仓库并提出了相应的数据仓库模型,这些模型简单实用,为构建航空公司客户关系管理系统搭建了一个基础平台,使得在该数据仓库之上的数据挖掘、数据分析功能更易于实现。  相似文献   

6.
分析了在分布式环境下,能否将各种数据挖掘工具挖掘到的知识和规则能够很好的共享的问题,借助了XML语言格式和PMML语言格式,使用Web(Web service)服务的方式来建立与平台无关的接口,采用动态的可扩展结构(UDDI),来搭建分布式环境下集成数据挖掘系统(dis- tributed data mining,DDM),本系统为地理上分布的软件之间如何协作及如何动态执行的问题提供了一个解决方案。  相似文献   

7.
分析了在分布式环境下,能否将各种数据挖掘工具挖掘到的知识和规则能够很好的共享的问题,借助了XML语言格式和PMML语言格式,使用Web(Web service)服务的方式来建立与平台无关的接口,采用动态的可扩展结构(UDDI),来搭建分布式环境下集成数据挖掘系统(distributed data mining,DDM),本系统为地理上分布的软件之间如何协作及如何动态执行的问题提供了一个解决方案。  相似文献   

8.
本文论述了数据挖掘的基本知识,包括数据挖掘的定义、数据挖掘的方法、数据挖掘的过程;讨论了从学院已有教学数据中通过数据挖掘技术找出可提高教学质量的几个方面.  相似文献   

9.
本文主要介绍了数据挖掘的技术并详细描述了数据挖掘的整个过程及需要注意的事项;另外还介绍了数据挖掘目前的应用情况,并列举了一些成功案例,最后对国内数据挖掘应用的现状进行了分析。  相似文献   

10.
随着计算机技术的迅猛发展,数据挖掘技术越来越受到世界的关注。从数据挖掘的概念出发,介绍了数据挖掘的对象、功能及其挖掘过程,结合数据挖掘的几种常见挖掘算法:决策树法、关联规则法和神经网络法等,对其主要思想及其改进做了相关描述;总结了国内外数据挖掘的研究现状和应用,指出了数据挖掘的发展趋势。  相似文献   

11.
数字图书馆中多媒体数据挖掘的体系结构和方法   总被引:1,自引:0,他引:1  
张英  赵艳君 《现代情报》2008,28(1):92-94
分析了目前数字图书馆的发展对多媒体数据挖掘提出的需求,提出了一种适合多媒体数据挖掘的系统框架,一般结构和挖掘过程;描述了各种媒体可用于挖掘的技术;讨论了多媒体数据挖掘技术今后发展可能遇到的问题和面临的问题.  相似文献   

12.
《科技风》2015,(21)
针对分散存储在各业务系统的各类业务数据,不能科学有效的进行处理和利用问题,提出了以搭建数据仓库为基础构建企业数据中心的概念,同时采用统计技术、数据挖掘技术对各类业务数据进行分析、挖掘,为企业提供综合决策分析和对未来发展趋势进行科学预测的能力。  相似文献   

13.
医学信息数据挖掘在医院信息系统的管理水平上、对远程医疗的帮助上及社区医疗进步上有着重要的作用。本文先对数据挖掘概念及功能进行详尽的论述,再通过医学数据挖掘的几项关键技术进行论述,阐述了建立于计算智能上的医学数据挖掘方法,了解在医学数据挖掘中的应用;最终再对数据挖掘在医学信息中存在的不足之处及方案进行讨论。  相似文献   

14.
为从大量的电能质量监测数据中提取出潜在的有用的信息,综述了数据挖掘在电能质量分析中的应用;介绍了数据挖掘的相关定义、处理过程、主要方法及发现的知识类型;概述了数据挖掘在电能质量数据预处理、扰动识别、谐波源定位中的相关应用,并就其应用前景进行了展望。  相似文献   

15.
基于SPSS知识地图的国内数据挖掘研究现状分析   总被引:1,自引:0,他引:1  
钱峰 《情报科学》2008,26(6):924-928
本文以CNKI数据库中1997—2006年与数据挖掘相关的期刊论文为基础,采用共词分析法与知识地图法绘制SPSS知识地图,进而分析国内数据挖掘的研究现状,最终得出三个结论:①在数据挖掘研究中,Web挖掘已与数据挖掘方法、数据挖掘的应用形成鼎立之势;②数据挖掘热点研究方法;③数据挖掘热点应用领域。  相似文献   

16.
目前我国的电子政务建设以海量数据整合为核心,通过对各类整合的信息资源进行数据挖掘,为政府决策提供科学依据,将有助于提升服务水平和降低经济成本。在介绍云计算技术的基础上,构建了基于云计算的政府决策支持系统的总体框架,描述了系统构建过程中的虚拟化、平台搭建以及服务实施阶段的具体内容,并对今后的工作提出了展望。  相似文献   

17.
谢嫚 《现代情报》2010,30(6):49-53
尝试在构建中国女性人物专题数据库的实践过程中运用数据仓库技术和数据挖掘技术,帮助学术研究者对这些人物在社会发展及其自身发展的某个具体层面中所呈现的典型现象进行分析。力图改善以往专题数据库建设在这方面局限性,为研究学者搭建更加深层次信息分析的研究平台。  相似文献   

18.
基于数据挖掘的客户关系管理系统的构建   总被引:8,自引:0,他引:8  
赵静  和斌 《情报杂志》2005,24(11):58-60
介绍了客户关系管理的内涵和特征,分析了传统客户关系管理面临的挑战;在此基础上分析了数据挖掘在客户关系管理中的应用,构建了基于数据挖掘的客户关系管理系统模型。  相似文献   

19.
潘庆超 《现代情报》2009,29(7):141-143
网格的数据挖掘是数据挖掘技术与网格计算的有机结合,文章介绍了网格数据挖掘的概念、特点、网格数据挖掘技术的优点,网格数据挖掘的体系结构,讨论了网格的数据挖掘的基本过程,并从开放网格服务体系结构出发,给出了网格平台下的信息服务质量数据挖掘的功能和执行过程。  相似文献   

20.
论数字图书馆数据挖掘系统模型研究   总被引:1,自引:0,他引:1  
周群 《情报杂志》2006,25(11):97-99
利用先进的数据挖掘技术,并与数字图书馆现有信息技术相结合,设计出新的数字图书馆数据挖掘系统模型;同时,对该系统在数字图书馆的应用进行了详细阐述。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号