共查询到20条相似文献,搜索用时 31 毫秒
1.
ETL即数据抽取、转换和加载,是构建数据仓库和数据挖掘的重要组成部分。首先探讨了ETL体系结构,然后,通过数据抽取、数据转换和数据加载3方面来全面阐述ETL的核心内容,并讨论分析了ETL工具实现的关键技术,为数据挖掘和数据仓库的搭建提供了强有力的支持。 相似文献
2.
本文简单介绍了决策树概念及C5.0算法原理,利用数据挖掘方法分析了移动客户的消费行为,搭建了一个基于内容营销目标客户的预测模型,提供了模型的分析方法及实例。 相似文献
3.
面对移动互联网中庞大的数据量,如何进行挖掘和可视化的分析是当前大数据研究的一个热点.本文搭建了一个互联网数据挖掘与分析平台,首先采用基于Scrapy框架搭建的爬虫系统从互联网络爬取了大量新闻数据与招聘数据,通过Sphinx和CoreSeek经过google-diff-match-patch算法去重,最后利用R语言对这些... 相似文献
4.
以Hadoop为代表的分布式系统,正在逐渐成为大数据挖掘系统必要组成部分。因此,就是在Hadoop分布式系统上完成数据挖掘任务的一次实践。主要任务是使用Hadoop搭建分布式集群环境,并在该环境上部署数据挖掘任务。研究Hadoop系统架构,对其分布式文件系统HDFS和MapReduce并行编程模型的原理和实现进行深入理解。系统掌握数据挖掘过程,将传统的数据挖掘算法使用MapReduce编程实现,并针对Hadoop平台的数据挖掘算法的执行情况进行研究,主要分析其执行效率和可扩展性。选择数据挖掘中的数据聚类任务作为代表,并选择K-means聚类算法做深入研究,掌握其原理并编写其MapReduce版本,在Hadoop平台上测试并验证其效果。通过不同集群规模和不同数据规模的对比试验得出,使用Hadoop分布式系统进行数据挖掘任务具有良好地加速比和效率,计算能力的扩展性能分析也显示了其具有较大的潜力。 相似文献
5.
数据仓库是构建客户关系管理系统的基础平台,针对航空领域业务数据特点构建数据仓库并提出了相应的数据仓库模型,这些模型简单实用,为构建航空公司客户关系管理系统搭建了一个基础平台,使得在该数据仓库之上的数据挖掘、数据分析功能更易于实现。 相似文献
6.
分析了在分布式环境下,能否将各种数据挖掘工具挖掘到的知识和规则能够很好的共享的问题,借助了XML语言格式和PMML语言格式,使用Web(Web service)服务的方式来建立与平台无关的接口,采用动态的可扩展结构(UDDI),来搭建分布式环境下集成数据挖掘系统(dis- tributed data mining,DDM),本系统为地理上分布的软件之间如何协作及如何动态执行的问题提供了一个解决方案。 相似文献
7.
分析了在分布式环境下,能否将各种数据挖掘工具挖掘到的知识和规则能够很好的共享的问题,借助了XML语言格式和PMML语言格式,使用Web(Web service)服务的方式来建立与平台无关的接口,采用动态的可扩展结构(UDDI),来搭建分布式环境下集成数据挖掘系统(distributed data mining,DDM),本系统为地理上分布的软件之间如何协作及如何动态执行的问题提供了一个解决方案。 相似文献
8.
本文论述了数据挖掘的基本知识,包括数据挖掘的定义、数据挖掘的方法、数据挖掘的过程;讨论了从学院已有教学数据中通过数据挖掘技术找出可提高教学质量的几个方面. 相似文献
9.
10.
11.
数字图书馆中多媒体数据挖掘的体系结构和方法 总被引:1,自引:0,他引:1
分析了目前数字图书馆的发展对多媒体数据挖掘提出的需求,提出了一种适合多媒体数据挖掘的系统框架,一般结构和挖掘过程;描述了各种媒体可用于挖掘的技术;讨论了多媒体数据挖掘技术今后发展可能遇到的问题和面临的问题. 相似文献
12.
13.
14.
15.
基于SPSS知识地图的国内数据挖掘研究现状分析 总被引:1,自引:0,他引:1
本文以CNKI数据库中1997—2006年与数据挖掘相关的期刊论文为基础,采用共词分析法与知识地图法绘制SPSS知识地图,进而分析国内数据挖掘的研究现状,最终得出三个结论:①在数据挖掘研究中,Web挖掘已与数据挖掘方法、数据挖掘的应用形成鼎立之势;②数据挖掘热点研究方法;③数据挖掘热点应用领域。 相似文献
16.
17.
尝试在构建中国女性人物专题数据库的实践过程中运用数据仓库技术和数据挖掘技术,帮助学术研究者对这些人物在社会发展及其自身发展的某个具体层面中所呈现的典型现象进行分析。力图改善以往专题数据库建设在这方面局限性,为研究学者搭建更加深层次信息分析的研究平台。 相似文献
18.
基于数据挖掘的客户关系管理系统的构建 总被引:8,自引:0,他引:8
介绍了客户关系管理的内涵和特征,分析了传统客户关系管理面临的挑战;在此基础上分析了数据挖掘在客户关系管理中的应用,构建了基于数据挖掘的客户关系管理系统模型。 相似文献
19.
网格的数据挖掘是数据挖掘技术与网格计算的有机结合,文章介绍了网格数据挖掘的概念、特点、网格数据挖掘技术的优点,网格数据挖掘的体系结构,讨论了网格的数据挖掘的基本过程,并从开放网格服务体系结构出发,给出了网格平台下的信息服务质量数据挖掘的功能和执行过程。 相似文献
20.
论数字图书馆数据挖掘系统模型研究 总被引:1,自引:0,他引:1
利用先进的数据挖掘技术,并与数字图书馆现有信息技术相结合,设计出新的数字图书馆数据挖掘系统模型;同时,对该系统在数字图书馆的应用进行了详细阐述。 相似文献