共查询到19条相似文献,搜索用时 406 毫秒
1.
ETL即数据抽取、转换和加载,是构建数据仓库和数据挖掘的重要组成部分。首先探讨了ETL体系结构,然后,通过数据抽取、数据转换和数据加载3方面来全面阐述ETL的核心内容,并讨论分析了ETL工具实现的关键技术,为数据挖掘和数据仓库的搭建提供了强有力的支持。 相似文献
2.
3.
ETL即数据抽取、转换、装载的过程,它是构建数据仓库的重要环节,而数据仓库是面向主题的、集成的、稳定的且随时间不断变化的数据集合。数据清洗是一个减少错误和不一致性、解决对象识别的过程,目前有很多数据清洗研究和ETL研究,但是如何在ETL过程中进行有效的数据清洗,此方面研究不多。本文将以此为问题出发点,探讨ETL中的数据清洗技术在税务系统(贵州省省直属局和九个地市州的原始数据)中的应用。 相似文献
4.
5.
如何能够更好的通过数据仓库进行决策分析是云计算下的数据挖掘研究的重要组成部分,基于Hive的数据仓库是为了能够快速的查询数据,通过ETL任务资源与调度可以使得查询的消耗达到最小,但ETL是一种类似的NP问题,本文将萤火虫算法引入到ETL任务资源调度中,将萤火虫个体的最优与ETL最优任务调度进行对应。实验平台采用某地区的面料交易平台进行研究,实验说明本文算法能够有效的提高ETL访问效率,从而加快了Hive的访问速度。 相似文献
6.
7.
BI即辅助公司高层领导决策。ETL即数据抽取、转换、装载的过程,作为BI决策分析系统的核心,能够按照统一的规则集成并提高数据的价值,是负责完成数据从数据源向目标数据仓库转化的过程,是实施数据仓库的重要步骤。 相似文献
8.
构造了基于数据仓库的市场信息系统,包括企业内部报告信息子系统、市场情报系统、专题市场调查信息子系统、数据仓库子系统和决策支持系统。对信息的搜集方式、ETL工具、数据仓库数据模型设计,OLAP工具和决策支持的实现方式做了探索。 相似文献
9.
文章介绍了ETL(Extract-Transform-Load)的实现,其主要作用在于对各类业务数据进行清理、标准化和汇总,为基于数据仓库的决策分析应用提供高质量的数据. 相似文献
10.
基于SQL优化提高数据仓库的ETL效率的方案 总被引:2,自引:0,他引:2
数据仓库的ETL过程基本是通过控制用SQL语句编写的存储过程和函数的方式来实现对数据的直接操作,实现数据库的高效管理。通过数据库表索引、游标的正确使用。数据抽取和上载时的SQL优化分析及方法。 相似文献
11.
基于数据仓库的CRM应用研究 总被引:1,自引:0,他引:1
客户关系管理(CRM)逐渐成为企业的焦点,也是数据仓库技术的重要应用领域,本文介绍了客户信息管理以及数据仓库技术,分析了数据仓库技术在CRM中的应用;阐述了目前数据仓库应用面临的困境;并从应用及技术的层面,分析了成功实现基于数据仓库的CRM的关键点. 相似文献
12.
在财务决策中,需对ERP财务模块中海量财务数据信息进行整合以做出最佳决策,因此如何对其构建数据仓库模型,成为财务决策需求的关键。以ERP财务模块为基础,结合数据仓库技术的应用,构建了ERP财务模块的数据仓库模型,为建立整个数据仓库系统并进而提高企业财务决策能力奠定了坚实的基础。 相似文献
13.
建立中国资源环境数据仓库的研究 总被引:5,自引:0,他引:5
资源环境数据仓库是面向资源环境的、综合的、不同时间的、稳定的数据集合,将分散在全国各个部门、不同平台的资源环境数据,经过抽取、转化、集成,建立中国资源环境数据仓库,为我国资源环境的决策提供有力的技术支持。资源环境数据仓库中可以设置若干个决策目标主题,根据不同的决策目标过程的,使原数据得到增值和统一,并致力于知识的发展。资源环境数据仓库的实施平台必须是一个开放式的系统,能支持多种平台和多种数据库,要有基于Internet的决策支持工具和GIS应用工具,满足各种不同用户的需要。 相似文献
14.
15.
数据仓库中元数据分类及管理系统研究进展分析 总被引:2,自引:0,他引:2
元数据管理向来是数据仓库技术研究的焦点和难点。本文综合了近年来关于数据仓库中元数据管理的相关文献,从数据仓库元数据组成、分类出发,进一步分析了数据仓库元数据管理系统所应具有的功能;并总结出数据仓库系统中主要的3种典型的元数据管理结构。 相似文献
16.
本文首先阐述了数据仓库的思想,并讨论了图书馆流通系统建立数据仓库的必要性,接着通过具体的例子分析了图书馆流通系统数据仓库的设计过程,从而实现数据仓库技术在图书馆流通系统中的应用,并通过具体的实例展示对流通系统数据仓库进行联机分析的结果。 相似文献
17.
GMMS是为满足证券行业构建数据仓库的需要而设计的行业通用元数据模型,本文在对证券行业的信息流和分析模式进行研究的基础上,根据数据仓库理论和Dublin Core的要求,提出了GMMS的设计方案,并对应用GMMS构建行业数据仓库的方法进行了介绍。 相似文献
18.
随着数据仓库理论的发展,数据仓库系统已逐步成为新型的决策管理信息系统的解决方案,而数据仓库系统的核心是联机分析处理。主要介绍了OLAP技术和多维数据领域中的一些基本概念及多维数据分析的主要方法和多维数据的3种存储模式:ROLAP、MOLAP、HOLAP。 相似文献
19.
基于数据仓库技术的虚拟企业合作伙伴选择系统设计 总被引:1,自引:0,他引:1
针对虚拟企业合作伙伴选择过程中,如何搜集和处理大量数据为伙伴选择提供依据的问题,提出了建立数据仓库的必要性,根据数据仓库的开发原理,结合实际情况设计了数据仓库的数据模型,并对如何进行数据搜集、数据转换和数据加载的过程进行了设计,为盟主企业分析和处理潜在伙伴信息提供了强有力的支持系统. 相似文献