首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 468 毫秒
1.
针对目前用于专利分析的数据存在来源单一、预处理操作不够、可挖掘程度浅等问题,设计并实现异构专利数据源集成方案,即从七国两组织的专利数据库获取数据到本地专利数据库;以本地数据库为基础数据源,利用SSIS工具通过ETL(数据抽取-数据转换-数据装载)操作,生成规范的、集成的高质量数据;进而将其加载到事先围绕KPI(关键性能指标)分析构建好的专利数据仓库中,从而为专利多维分析以及数据挖掘提供有效的数据支持。  相似文献   

2.
为预防和控制ETL中所存在的管理不善的问题,保证数据仓库高效的ETL实施,设计基于CWM元数据标准的ETL元数据库系统模型,该模型能描述数据变换的具体步骤,并根据此模型设计系统,从而有效地实现ETL过程管理。  相似文献   

3.
ETL技术及其在数字图书馆中的应用研究   总被引:8,自引:0,他引:8  
黄永文  李广建 《图书馆杂志》2006,25(2):46-50,54
简要介绍了ETL的背景,分析了ETL的实现过程和体系结构,对国内外关于ETL的研究内容和现状进行了详细论述,最后提出了ETL技术在数字图书馆领域中的应用。  相似文献   

4.
高校校园网信息资源数量巨大.各信息发布系统的相互独立及多种异构数据源的使用对在校园网范围内进行统一的信息检索设置了障碍.系统着重解决由非结构化文本数据和结构化数据库数据形成的多数据源的集成与整合问题.在Nutch搜索引擎基础上利用Lucene接口对多种源数据建立索引.构建多数据源全文信息检索平台,从而有效地实现全网信息检索并提高检索速度和精度。  相似文献   

5.
中文图书编目与外部数据源的利用   总被引:11,自引:0,他引:11  
蒋凌慧 《图书馆》2002,(3):39-41,63
信息技术的发展带来了编目数据源的多样化。充分利用各类外部数据源,对于降低编目难度、提高工作效率和促进编目工作标准有着重要意义。文章分析了各类外部数据源的特点和利用方法,并指出以联机联合编目为主。其他外部数据源利用为辅是外部数据的最佳策略。  相似文献   

6.
总结数字图书馆领域中与ETL相关的研究,在此基础上提出数字图书馆中ETL的分类,最后结合数字图书馆的应用需求和发展趋势,从ETL在数字图书馆资源建设、数字图书馆用户服务、实现数字图书馆与其他系统之间互操作3个方面,详细分析和研究数字图书馆中ETL的应用方式。  相似文献   

7.
ͼ���Ŀ�����ⲿ����Դ��̽   总被引:6,自引:1,他引:5  
结合西安交通大学图书馆实践,并针对目前我国图书馆计算机编目中存在的数据质量和工作效率问题,提出利用外部数据源这一解决问题的方法。  相似文献   

8.
在科学标本数据的规范化集成整编中,标准和规范是前提,资源数据的整合、集成是核心。ETL技术能够实 现对数据的抽取、转换和装载。本文将其引入到科学标本数据规范化集成整编中,实现对多源的、异构的标本数据的 汇集和整合,并以岩矿化石标本数据集成整编为例进行应用实践,取得了较好的应用效果,证明了应用ETL技术实现 标本数据规范化集成整编的有效性。该方法具有一定的实践借鉴意义,可为其他资源数据的规范化集成整编提供一定 的科学参考。  相似文献   

9.
随着图书馆信息化程度的提高,在实际工作中经常要对大量不同格式的数据进行转换,本文介绍了一种可以进行异类数据源转换的工具.即SQL Server的DTS(Data Transforma—tion Services)工具.详细介绍了如何使用这个工具进行异类数据源的转换。  相似文献   

10.
Cross-Search系统的设计与实现   总被引:2,自引:0,他引:2  
本文主要对跨库集成检索系统Cross-Search的设计思想。系统结构及功能模块实现进行了较为全面的介绍,系统主要解决了对异构数据源的连接,统一格式转化及处理和并发检索等方面的问题,对多数据源的同步检索给出了较为理想的解决方案,并予以实现。  相似文献   

11.
在大数据的背景下,结合对高校信息化中服务发展的需求,提出建立智能高校信息化管理服务系统的思路。依据大数据的基本思想,首先提出高校大数据的概念并分析其基本特征。对智能高校信息化服务具体体现方式进行研究,详细阐述建设智能高校信息化管理服务系统的原则和构架设计的逻辑框架,进一步探讨在实践中ETL、数据仓库建模等关键技术,以实例说明智能信息化管理中的数据应用服务和决策支持,为全面建立智能化的高校信息化管理服务系统提供探索和实践基础。  相似文献   

12.
在分析关系数据库中MARC数据存储特点的基础上,给出一种MARC数据镜像系统的设计方案。该方案通过引入文件传输服务器使得源数据库和目的数据库在进行数据复制时把远程操作转化成本地操作,把记录同步转化成网络文件传输,使得源数据库和目的数据库之间的数据复制可靠、快速而且有效。  相似文献   

13.
文章以地方文献数据资源为例,介绍一种在ILAS图书馆自动化系统中创建编目数据库的方法,该方法既简便又行之有效。  相似文献   

14.
[目的/意义]数据源描述(又称数据源摘要)是Deep Web集成检索领域存在的关键问题之一,数据源描述的质量直接影响着集成检索系统的检索效率和效果。本文提出一种基于领域特征和用户查询取样的数据源描述方法,以期为非合作环境下资源集成应用与研究提供参考和借鉴。[方法/过程]该方法为异构非合作型数据源的离线取样方法,通过分析数据源和用于查询的领域主题属性,依次构建领域特征词集、初始特征词集和高频特征词集,并最终获得以高频特征词查询取样的数据源描述信息。结合流行的CORI算法,深入分析基于推理网络的用户查询与数据源描述的相关度计算方法,并基于此方法设计基于Lemur工具集的集成检索系统,验证了上述方法的有效性。[结果/结论]所提方法在查全率和查准率方面均得到很好的表现。与其他方法相比,该方法在样本数据自动更新和运维管理方面具有明显成本优势和实用价值。  相似文献   

15.
数字期刊是高校数字图书馆建设的重要组成部分,在高等学校的教学与研究中起着重要的作用,如何对检索出的期刊进行有效的价值评估,为读者进行文献参考提供决策支持,是本文的研究方向。联机分析处理(OLAP)作为商业智能领域的成熟数据处理技术,其优势是能够基于海量数据为用户提供高效、实时、多角度的数据展现。本文将OLAP技术应用到期刊评价领域,并基于ROLAP模式开发了一个完整的期刊评价系统,阐述了数据清洗、数据仓库及多维数据模型构建、期刊评价的OLAP操作实现等各个环节的实现原理及基本流程。  相似文献   

16.
Internet信息资源数据库及其实现   总被引:1,自引:0,他引:1  
张清文 《情报学报》2002,21(5):547-552
Internet信息资源数据库是指以Internet信息资源为数据来源 ,对Internet上的各种信息资源进行综合分析处理而形成的数据库。文章对Internet信息资源数据库的定义、建设的意义及其实现机制作了探讨。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号