共查询到10条相似文献,搜索用时 15 毫秒
1.
本文从“数字出版”和“大数据出版”的概念辨析入手,指出两者最大的差异是后者能够通过对信息的数据化(结构化)处理来实现出版资源的重新整合与最大化利用;以自然灾害类历史典籍为例,说明“大数据出版”能通过建设专题数据库的途径实现对出版物资源的数据采集、存储和检索,并在数据库平台上进行数据挖掘和可视化呈现,以生产新的知识和产生新的价值;最后总结了“大数据出版”给出版行业重塑自身的核心竞争力、资源整合与服务方式、版权保护与交易方式带来的新契机. 相似文献
2.
由于受到信息安全和检索效率等因素的限制,怎样能在信息安全的基础上提升科技文档共享的广泛性和深入性成为一个亟待解决的问题。本文引入结构化的科技文档资源存储模式,在此基础上实现基于知识库的高效检索策略,通过构建科技文档的采集与分词算法,实现了基于XML的语义检索。 相似文献
3.
数字图书馆传统的关系数据库数据存储方式已不能满足大数据存储与处理需求,为解决传统关系型数据库在海量数据存储和访问效率中的瓶颈问题,论文提出了一种数字图书馆安全、有效的大数据公布式存储架构。该存储架构具有良好的可扩展性、容错性和存储性能,尤其针对海量的非结构化、半结构化数据,其性能优势更加明显。 相似文献
4.
5.
基于传统文本检索系统的XML索引实现研究 总被引:3,自引:0,他引:3
作为重要的信息交换与存储标准,XML得到学者们越来越多的重视。作为XML检索研究的重要组成部分,XML索引机制与实现的研究已经取得了一定的研究成果。然而,大部分研究都是基于数据库及专门的半结构化管理器之上的。本文提出了如何在传统文本检索系统Okapi的基础上构建XML索引的方法。首先介绍了Okapi的索引结构,在此基础上,深入探讨了XML索引的存储结构及实现,并对索引的性能进行了评价。 相似文献
6.
7.
为了解决日益增长的海量测震波形数据在存储和管理方面存在的性能瓶颈问题,基于测震波形数据管理的
业务需求,选取基于Hadoop大数据技术的分布式文件系统HDFS 和分布式计算Spark架构进行数据的存储和计算,并开
发基于Web 的测震波形数据存储和管理系统,实现对海量测震波形数据的可视化管理和数据运行率检索。 相似文献
8.
9.
聂峰英 《中国科技资源导刊 (中国信息导报)》2015,(5):56-62
契合大数据环境下气象服务的形势和需求,通过气象大数据服务协同模式来解决传统气象服务模式所遭遇
的瓶颈。概述气象大数据特征,研究气象大数据的集成与服务,分析数据的采集聚合与处理,提出服务协同模式。构
建面向用户体验支持可视化人机交互的气象大数据服务协同模型。依托大数据技术,通过协同优化服务,集数据采集
聚合、专业化协同处理、用户管理于一体,实现气象服务的协同、整合、规模化,以解决气象服务“孤岛”现象。 相似文献
10.
Lucene全文检索的应用及检索效率测试研究 总被引:1,自引:0,他引:1
使用Lucene设计一个全文检索系统,系统由三大功能模块组成:索引模块、检索模块和存储模块.第二部分着重分析PDF数据转换,XML文档设计,索引的分词、建立及效率等技术难点,并对中文分词分析器、索引文件膨胀率、索引影响因子及检索系统并对检索响应时间进行测试.应关注XML数据库的安全性. 相似文献