共查询到20条相似文献,搜索用时 296 毫秒
1.
Eduardo N. Borges Moisés G. de Carvalho Renata Galante Marcos André Gonçalves Alberto H.F. Laender 《Information processing & management》2011
Digital libraries of scientific articles contain collections of digital objects that are usually described by bibliographic metadata records. These records can be acquired from different sources and be represented using several metadata standards. These metadata standards may be heterogeneous in both, content and structure. All of this implies that many records may be duplicated in the repository, thus affecting the quality of services, such as searching and browsing. In this article we present an approach that identifies duplicated bibliographic metadata records in an efficient and effective way. We propose similarity functions especially designed for the digital library domain and experimentally evaluate them. Our results show that the proposed functions improve the quality of metadata deduplication up to 188% compared to four different baselines. We also show that our approach achieves statistical equivalent results when compared to a state-of-the-art method for replica identification based on genetic programming, without the burden and cost of any training process. 相似文献
2.
元数据是数字信息组织和处理的基本工具,为各种形态的数字化信息提供规范、普遍的描述基准和方法。电子文件管理元数据是电子文件管理系统的核心组成部分。 相似文献
3.
数据仓库中元数据分类及管理系统研究进展分析 总被引:2,自引:0,他引:2
元数据管理向来是数据仓库技术研究的焦点和难点。本文综合了近年来关于数据仓库中元数据管理的相关文献,从数据仓库元数据组成、分类出发,进一步分析了数据仓库元数据管理系统所应具有的功能;并总结出数据仓库系统中主要的3种典型的元数据管理结构。 相似文献
4.
网络信息资源组织—Dublin Core元数据 总被引:25,自引:0,他引:25
本文从元数据的定义入手,分析了Dublin Core元数据的产生及其功能,并在此基础上阐述了DC元数据与USMARC的映射,进而对DC元数据与编目数据进行比较,对两者的联系的区别作了详细的分析和论述,从而对DC元数据有了比较清晰的认识。 相似文献
5.
我国元数据研究现状分析 总被引:16,自引:0,他引:16
元数据是当前我国图书情报和计算机领域研究的热点。本文从元数据的相关知识,保存元数据.数据仓库中的元数据及中文元数据研究几方面进行了论述,并展望了未来的发展趋势。 相似文献
6.
介绍了元数据的基本内容和MapGIS数据中心的基本概念;重点说明了基于MapGIS数据中心二次开发的元数据管理系统的基本思想与实现方案。 相似文献
7.
Metadata is designed to improve information organization and information retrieval effectiveness and efficiency on the Internet. The way web publishers respond to metadata and the way they use it when publishing their web pages, however, is still a mystery. The authors of this paper aim to solve this mystery by defining different professional publisher groups, examining the behaviors of these user groups, and identifying the characteristics of their metadata use. This study will enhance the current understanding of metadata application behavior and provide evidence useful to researchers, web publishers, and search engine designers. 相似文献
8.
XML:数字图书馆信息组织的基础技术 总被引:4,自引:0,他引:4
数字图书馆的信息对象以网络为存在基础,具有海量性和异构性。针对这些特性,文章在分析标记语言SGML、HTML的优缺点及XML的优势的基础上,选择XML作为数字图书馆信息组织的技术。举例说明XML在数字图书馆元数据描述中的具体应用。文章最后指出XML广阔的使用前景为其在数字图书馆中的应用提供了更大的发展空间。 相似文献
9.
10.
11.
In this work, we elaborate on the meaning of metadata quality by surveying efforts and experiences matured in the digital library domain. In particular, an overview of the frameworks developed to characterize such a multi-faceted concept is presented. Moreover, the most common quality-related problems affecting metadata both during the creation and the aggregation phase are discussed together with the approaches, technologies and tools developed to mitigate them. This survey on digital library developments is expected to contribute to the ongoing discussion on data and metadata quality occurring in the emerging yet more general framework of data infrastructures. 相似文献
12.
DC元数据与网络信息资源的描述 总被引:11,自引:0,他引:11
元数据是描述数据的数据,DC是元数据格式中发展较为成熟的一种,其特点表现为简单性、通用性、兼容性及可扩展性。分析了基于XML的用DC描述网络信息资源的格式,指出在我国对DC的研究正从纯理论研究阶段步入实际应用性阶段。 相似文献
13.
Metadata初探 总被引:7,自引:4,他引:7
随着计算机技术与网络通信的进步,人类社会迈进了崭新的信息网络时代,电子图书馆相关计划普遍受到了各界的重视。而构建电子图书馆一个必要的步骤是将现有的馆藏、出版品经过电子化处理,并提供信息的检索、查询、浏览以及传递。在电子化转换的过程中需要适合在网络环境中有效管理电子资源、并能呈现不同馆藏特色的资源描述格式。Metadata,这个新的电子资源描述格式(或称电子资源组织模式),已成为发展电子图书馆计划首要考虑的问题。本文将就Metadata电子资源描述格式作简略的介绍。 相似文献
14.
数字资源整合是现阶段图书馆发展的必然趋势。笔者根据所在单位开展数字资源整合平台的建设经验, 介绍了国内外有代表性的资源整合系统,对比了国内主要的资源整合模式,明确了资源整合的目标,具体描述了基于元数据仓储的数字资源整合平台的建设过程,主要包括元数据仓储的建设、统一检索系统的建设和资源调度系统的建设。 相似文献
15.
高校复合图书馆馆藏特点及其资源建设策略探讨 总被引:8,自引:0,他引:8
复合图书馆馆藏具有其自身的特点。因此在复合图书馆初级阶段,信息资源建设要以纸质文献为主,正确处理好书与刊的关系。数字化费源的建设应以存取为主,注重联合发展,并加强网络学术信息资源的采集和管理。馆藏资源在突出特色的同时还必须加强整合。 相似文献
16.
17.
Metadata在数字资料的典藏中起着极其重要的作用。本文试图从数字典藏的策略及Metadata对数字典藏的重要性,进一步探讨用于数字典藏的Metadata要素及相关问题。 相似文献
18.
构建网络环境下的馆藏资源建设评价体系 总被引:1,自引:0,他引:1
本文介绍了在网络环境下传统馆藏资源内容和形式上的变化,提出了传统馆藏资源建设评价存在的局限性,并从馆藏信息资源保障能力、信息资源质量评估、信息资源共享能力、资源利用效果四方面建立了新的评价体系. 相似文献
19.
20.