首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 656 毫秒
1.
在科学标本数据的规范化集成整编中,标准和规范是前提,资源数据的整合、集成是核心。ETL技术能够实 现对数据的抽取、转换和装载。本文将其引入到科学标本数据规范化集成整编中,实现对多源的、异构的标本数据的 汇集和整合,并以岩矿化石标本数据集成整编为例进行应用实践,取得了较好的应用效果,证明了应用ETL技术实现 标本数据规范化集成整编的有效性。该方法具有一定的实践借鉴意义,可为其他资源数据的规范化集成整编提供一定 的科学参考。  相似文献   

2.
公共文化服务大数据集成架构设计研究   总被引:1,自引:0,他引:1  
[目的/意义] 针对当前各图书馆、文化馆等公共文化服务机构的多源异构数据,设计出一套行之有效的集成架构。[方法/过程] 在充分分析公共文化大数据资源的基础上,对公共文化服务大数据的类型与分布进行分析,结合公共文化服务大数据的应用场景,设计公共文化大数据集成的架构。[结果/结论] 提出一个由数据来源层、系统集成层、数据融合层、存储层、应用层五个层次构成的公共文化服务大数据集成架构,并对其中的采集、存储等关键技术进行研究。  相似文献   

3.
对多源数据融合的高校图书馆知识服务模式进行了研究,介绍了多源数据融合的内涵与实践意义,对多源数据融合理论在高校中的应用进行了详细阐述。从数据融合目标、系统及数据资源共享共建角度分析了多源数据融合的高校图书馆知识服务模式,最后着重提出高校图书馆实现多源数据融合的知识服务模式创新路径。  相似文献   

4.
地学数据资源具有多源、分散、异构等特征,为了能够充分共享和利用地学数据资源,必须有效集成并建 立地学数据库,但是传统地学数据建库方法存在着难以系统地认知建库对象,缺乏统一的语义支撑等问题。针对这些 问题,本文提出并定义了地学数据本体模型、概念体系及其构建方法,阐述了基于地学数据本体的数据建库方法和流 程。该方法在数据本体明确语义的支撑下,抽取出完善的数据实体关系模型,实现多源、异构数据的映射、转换与规 范化处理,并利用数据本体准确表达数据库的语义信息。最后以贵州岩溶地下水数据库构建为例,进行了方法的应用 验证。研究表明:地学数据本体通过对数据资源全生命周期共识概念、属性、实例及其关系的形式化描述,可以有效 克服传统地学数据建库方法的缺陷,更好地支撑和促进地学数据资源的集成建库。  相似文献   

5.
多源空间数据共生问题自地理信息系统(GIS)产生以来一直存在,多源信息的集成和融合是地球信息科学领域的一大热点问题.它的意义和必要性与地球信息本身的特征、采集手段特征、信息处理平台或系统的特点紧密相联,它的应用和集成备受关注.文章解析了多元空间信息集成的概念、理论源流、研究现状及该技术问题的解决途径.  相似文献   

6.
 针对目前电子政务中空间数据集成分析功能研究不足的现状,提出一种有效的空间数据转化集成方法,将地理空间数据、非空间属性数据、空间谓词数据以及电子政务事务数据进行集成,构成面向政务分析的更为全面的数据源。在此基础上,设计多维空间数据模型来集成这些数据源。突破现有GIS查询分析功能,支撑更为复杂的空间数据与非空间数据联动查询的模式。  相似文献   

7.
吴胜  苏琴 《图书情报工作》2011,55(24):112-115
指出Web3.0中的数据整合涵盖数据集成、知识集成、服务集成、信息集成4个层次,认为进行Web3.0数据整合时,面临着层次多、方向多、目标多且不确定、整合频率高、涉及技术多等问题,这些问题使得数据整合复杂度高。分析数据整合任务,并提出一个通用的Web3.0数据整合流程模型--ASMCSA模型。该模型涵盖数据的分析、规范、映射、采集、存储、应用等环节。  相似文献   

8.
胡滨 《图书情报工作》2012,56(12):45-100
分析国内农村信息服务平台存在的主要问题,介绍常见的基于数据、基于模式和基于用户等三种架构的基本情况;提出面向协同服务的农村信息集成平台架构,阐述多源异构数据交换技术,并通过应用实例验证该架构在服务能力和资源利用等方面的优势。  相似文献   

9.
[目的/意义]从理论、方法、技术与应用的视角研究大数据环境下的多源信息融合问题。[方法/过程]探索多源信息融合的理论基础与科学依据,梳理多源信息融合的问题与现象,对多源信息融合的技术与方法进行归纳总结,对构建大数据环境下的多源信息融合应用进行探讨。[结果/结论]大数据环境下的多源信息融合理论包括相关性原理、多元表示原理、意义建构理论等,多源信息融合方法包括统一标识、数据比对、异构加权等一系列过程以及多种分析建模方法,多源信息融合在国家层面、城市或行业组织层面、企业机构层面都有着广泛的需求与应用。  相似文献   

10.
王一博  张鹏翼 《图书馆建设》2024,(1):121-130+145
融合图书馆用户数据、Web图书数据的新型高校图书馆书目系统分为数据准备和数据清洗、数据规范和数据集成、数据分析和结果呈现三个模块;用户数据源来自北京大学图书馆数据资源服务中心的用户及其行为数据和馆藏资源及其使用数据,Web数据源包括豆瓣读书数据、当当图书数据、京东图书数据以及中国知网引文数据;数据处理方法包括数据清洗、数据规范和数据集成;系统实现的三个关键技术为融合用户数据及内容的图书推荐方法、豆瓣读书笔记的摘要和关键词生成方法以及情感分析方法。该书目系统聚焦于解决书目信息单一的问题,通过集成和分析图书馆用户数据和Web图书数据,丰富书目信息的内容,为下一代图书馆书目系统的设计与实现提供了参考。  相似文献   

11.
文章以地方文献数据资源为例,介绍一种在ILAS图书馆自动化系统中创建编目数据库的方法,该方法既简便又行之有效。  相似文献   

12.
基于Hadoop的海量共现矩阵生成方法   总被引:4,自引:0,他引:4  
海量数据的处理分析是当前信息处理技术的热点之一,介绍开源并行系统Hadoop的体系结构以及基于Hadoop的MapReduce编程框架,并在Hadoop基础上提出一种通过多重MapReduce操作,实现海量共现矩阵的生成方法。  相似文献   

13.
专利引证分析工具的设计与实现   总被引:1,自引:0,他引:1  
专利引证分析在专利分析中的作用越来越大。文章介绍了一个专利引证分析工具的设计与实现,包括数据的获取、清洗、转换和生成图形,并进行了简单的应用分析。同时,介绍了一个开源的可视化工具包Prefuse,希望对想通过用可视化手段进行文献分析的研究人员提供有益的启示。  相似文献   

14.
《期刊图书馆员》2012,62(1-4):155-158
Managing the myriad details involved in the provision of electronic resources is a challenging task. The Florida Center for Library Automation began using Drupal, an open source content management system to help with this process. This session introduced Drupal, explained its advantages, and demonstrated how it could be used to easily organize data about electronic resources and create displays that will be useful to the intended audience.  相似文献   

15.
国外数字图书馆系统开源软件研究趋势   总被引:6,自引:2,他引:6  
全面介绍国外数字图书馆系统开源软件的研究现状,包括对开源系统软件的扩展与改进、多种开源软件的结合以及开源软件与其他技术的结合。  相似文献   

16.
西文生物医学期刊文献数据库(EMCC)建设   总被引:5,自引:0,他引:5  
该研究以解放军医学图书馆外文期刊为对象,建立馆藏西文医学期刊文献文摘数据库。通过对馆藏西文期刊资源分布的调研,提出数据库来源刊的选择、数据加工和数据整合的指导原则。文章概括了数据库结构、类型、规模和特点,系统介绍了数据库的检索特点和服务模式。同时,强调了数据库建设的意义和产生的作用。  相似文献   

17.
张晓源 《图书与情报》2006,(1):69-73,79
在制定人物数据库的收录标准时,人物特征的多重属性与流动性、发展变化性、数据库建库目的与服务对象及人物信息来源等都是需要考虑的因素。其中“名人”的收录标准需制定舆体量化指标:“地方人物”则应以“籍贯”和“活动地点”为主要选择依据。  相似文献   

18.
[目的/意义]理论作为科学研究的基础,在科研成果中有着不可取代的作用,统计分析我国图书馆学博士学位论文中理论应用情况,对揭示当前图书馆学研究中的理论应用概貌及构建图书馆学学科理论体系具有重要的理论和实践意义。[方法/过程]以我国图书馆学博士学位论文为样本进行理论抽取,采用内容分析、信息计量以及可视化分析方法对理论应用的频次、理论与研究主题的关联以及理论来源学科等进行多角度统计分析。[结果/结论]博士学位论文中引入的理论种类繁多,学科交叉性强;理论名称使用不规范,同种理论使用多种理论名称;博士学位论文中引入理论的应用层次不高。图书馆学研究需注重基础理论的研究;理论应用具有较强的时代特征;信息科学相关学科将在图书馆学研究中起主导作用。  相似文献   

19.
王若佳  李培 《图书情报工作》2016,60(18):122-132
[目的/意义] 分析国内互联网搜索数据和我国流感疫情的相关性,探讨利用搜索数据辅助流行病监测的应用可能,为相关搜索引擎和疾病防控中心提供参考。[方法/过程] 通过分析百度中文搜索词搜索情况和我国流感活动情况的相关性,选择合适的搜索关键词,构建并比较一元线性回归、多元线性回归、主成分回归及人工神经网络模型,选出最优模型;引入官方发布的流感监测历史信息,进行模型优化。[结果/结论] 多元线性回归和人工神经网络模型具有更好的拟合优度,其中多元线性回归的精度更高;主成分回归模型在理论上可以减少变量之间的共线性,但实践证明无论是其拟合效果还是监测效果相对于多元回归模型来说都有所下降;历史数据和搜索数据包含的信息具有一定程度的互补性,综合使用两种数据具有最好的监测效果。  相似文献   

20.
从多个RDFS本体中抽取子本体   总被引:4,自引:0,他引:4  
RDFS本体提供了用于表达语义信息的通用框架,是语义网的基础。本体规模的增大使得对于特定领域知识利用的效率降低,从中抽取领域子本体可解决此问题。单个本体中包含的领域知识有限,从多个本体中抽取子本体可获取更多的领域知识。将RDFS本体抽象为图模型,根据RDFS推理规则和本体间映射,生成多个RDFS源本体的联合闭包。应用图理论构建抽取算法,生成以领域概念为节点的子图,得到所需的领域本体。该方法对于RDFS层次的领域本体抽取有一定的适用性,可快速有效地构建领域本体。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号