首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
本文从“数字出版”和“大数据出版”的概念辨析入手,指出两者最大的差异是后者能够通过对信息的数据化(结构化)处理来实现出版资源的重新整合与最大化利用;以自然灾害类历史典籍为例,说明“大数据出版”能通过建设专题数据库的途径实现对出版物资源的数据采集、存储和检索,并在数据库平台上进行数据挖掘和可视化呈现,以生产新的知识和产生新的价值;最后总结了“大数据出版”给出版行业重塑自身的核心竞争力、资源整合与服务方式、版权保护与交易方式带来的新契机.  相似文献   

2.
由于受到信息安全和检索效率等因素的限制,怎样能在信息安全的基础上提升科技文档共享的广泛性和深入性成为一个亟待解决的问题。本文引入结构化的科技文档资源存储模式,在此基础上实现基于知识库的高效检索策略,通过构建科技文档的采集与分词算法,实现了基于XML的语义检索。  相似文献   

3.
数字图书馆传统的关系数据库数据存储方式已不能满足大数据存储与处理需求,为解决传统关系型数据库在海量数据存储和访问效率中的瓶颈问题,论文提出了一种数字图书馆安全、有效的大数据公布式存储架构。该存储架构具有良好的可扩展性、容错性和存储性能,尤其针对海量的非结构化、半结构化数据,其性能优势更加明显。  相似文献   

4.
在信息界元数据被定义为:提供关于信息资源或数据的一种结构化的数据,是对信息资源的结构化的描述。由于元数据提供对档案信息的结构化描述和科学的组织,从而使得档案信息实现快速检索、永久存储和标准化传递,因此在档案信息资源共享中有广泛的应用。  相似文献   

5.
基于传统文本检索系统的XML索引实现研究   总被引:3,自引:0,他引:3  
陆伟 《情报学报》2006,25(6):679-685
作为重要的信息交换与存储标准,XML得到学者们越来越多的重视。作为XML检索研究的重要组成部分,XML索引机制与实现的研究已经取得了一定的研究成果。然而,大部分研究都是基于数据库及专门的半结构化管理器之上的。本文提出了如何在传统文本检索系统Okapi的基础上构建XML索引的方法。首先介绍了Okapi的索引结构,在此基础上,深入探讨了XML索引的存储结构及实现,并对索引的性能进行了评价。  相似文献   

6.
文本挖掘中的知识模式表示、评价及检索机制   总被引:1,自引:0,他引:1  
在当前的文本挖掘中,缺乏检索机制,即使对于挖掘到的简单事实也很难被其他用户检索到,对于知识模式更难达到共享。因此应该建立知识模式库,对文本挖掘得到的知识模式采用统一的表示方式、统一的评价标准、统一的检索机制,让任何一种模式都能被对它感兴趣的用户检索到,进而加以利用。本文提出了一种知识模式的框架表示方法,对文本挖掘出的模式进行统一表示、存储,构建知识库,并对知识库中的模式进行内部和外部评价,利用语义相似及领域知识对知识库中的模式进行检索。  相似文献   

7.
为了解决日益增长的海量测震波形数据在存储和管理方面存在的性能瓶颈问题,基于测震波形数据管理的 业务需求,选取基于Hadoop大数据技术的分布式文件系统HDFS 和分布式计算Spark架构进行数据的存储和计算,并开 发基于Web 的测震波形数据存储和管理系统,实现对海量测震波形数据的可视化管理和数据运行率检索。  相似文献   

8.
本文以某国有大型企业在实现整体产销信息化后,为确保产销系统数据的安全及应用系统的连续性,利用IBM DS8000高端存储具有的智能数据复制功能实现数据级同城异地灾难备份为案例,介绍了其系统架构、系统迁移切换及系统性能测试的相关应用情况。  相似文献   

9.
契合大数据环境下气象服务的形势和需求,通过气象大数据服务协同模式来解决传统气象服务模式所遭遇 的瓶颈。概述气象大数据特征,研究气象大数据的集成与服务,分析数据的采集聚合与处理,提出服务协同模式。构 建面向用户体验支持可视化人机交互的气象大数据服务协同模型。依托大数据技术,通过协同优化服务,集数据采集 聚合、专业化协同处理、用户管理于一体,实现气象服务的协同、整合、规模化,以解决气象服务“孤岛”现象。  相似文献   

10.
Lucene全文检索的应用及检索效率测试研究   总被引:1,自引:0,他引:1  
使用Lucene设计一个全文检索系统,系统由三大功能模块组成:索引模块、检索模块和存储模块.第二部分着重分析PDF数据转换,XML文档设计,索引的分词、建立及效率等技术难点,并对中文分词分析器、索引文件膨胀率、索引影响因子及检索系统并对检索响应时间进行测试.应关注XML数据库的安全性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号