首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 937 毫秒
1.
XML信息检索探究   总被引:4,自引:0,他引:4  
廖述梅  万常选  徐升华 《情报学报》2007,381(2):229-234
XML文档是具有层次结构和文本内容的半结构化数据。现有的Web信息检索是基于HTML文档的关键词全文检索,无法胜任XML元素粒度的检索;同时,XML数据库检索实现的是精确查找,检索结果无排序支持。因此,融合信息检索和数据库技术研究XML检索问题成为必然。本文从XML检索的问题域出发,阐述了XML信息检索(XML IR)的国内外研究现状与特点,并分析了目前XML IR的热点和难点问题。  相似文献   

2.
高校校园网信息资源数量巨大.各信息发布系统的相互独立及多种异构数据源的使用对在校园网范围内进行统一的信息检索设置了障碍.系统着重解决由非结构化文本数据和结构化数据库数据形成的多数据源的集成与整合问题.在Nutch搜索引擎基础上利用Lucene接口对多种源数据建立索引.构建多数据源全文信息检索平台,从而有效地实现全网信息检索并提高检索速度和精度。  相似文献   

3.
基于规则的信息抽取,设计了信息抽取的规则文档,再利用XML技术对PDF格式的台湾科技文献进行信息抽取,并将所得的结构化数据导入SQLSERVER数据库,最后利用ASP技术构建一个方便、智能的信息检索平台。  相似文献   

4.
认为利用关键词对结构化数据进行查询,实现信息检索和数据库查询的融合的技术已成为热点研究问题。基于模式图的检索算法是目前数据库关键词检索研究的技术之一。现有的模式图算法仍然存在着检索效率低下、查询准确率不高等问题。在对现有算法进行改进的基础上,设计并实现一个基于改进算法的系统,实验表明,使用改进算法的系统具有更高的检索性能和检索效率。  相似文献   

5.
在分词技术、索引技术、结构化查询语言技术的基础上,提出了一个基于XML文档数据库的信息检索系统,这一系统模型主要由分词模块、索引模块及查询模块组成。  相似文献   

6.
在数字图书馆中进行信息检索是一件繁琐和乏味的工作,由于无法识别用户的检索个性化,导致信息检索的结果不尽如人意。我们在数字图书馆的信息检索系统中,将系统集中在查询个性化;特别地,我们处理结构化的检索使存储的原数据加入相关的数据库中,通过对用户描述文件里的用户偏好的分析,描述了查询重写规则在构建个性化检索中的作用。  相似文献   

7.
非结构化数据库在数字化图书馆发展中的应用   总被引:6,自引:0,他引:6  
擅长于处理结构化数据的关系数据库已渐渐适应不了数字化图书馆的发展需要.因此基于网络应用的非结构化数据库应运而生。文章根据非结构化数据库的特征,论述了它在数字化图书馆发展中为数字信息资源建设提供技术支持及在开展各层次信息服务等方面的应用。  相似文献   

8.
近年来国外在多语言信息组织与检索研究领域取得了显著进展。本文以WoS、ACM、Emerald、Elsevier、ProQuest、Springer等数据库收录的文献为基础,对近10年来该领域的研究进行述评。国外研究重点关注以下问题:多语言本体构建与协调,基于关联数据的多语言语义网建设,跨语种语言资源和知识组织系统互操作,多语言文本分类与聚类,多语言环境下的用户信息行为,多语言信息检索模型,多语言信息检索方法与技术,多语言信息检索系统开发及评估,特定领域的多语言信息检索,交互式多语言信息检索。对我国的启示主要体现在:加强实证研究方法的应用,开发面向实用的多语言信息检索系统,注重基于语义的信息组织与检索研究,拓展特定学科领域应用研究。  相似文献   

9.
走出数据库建设的误区,营造良好的网络检索环境   总被引:7,自引:0,他引:7  
关于数据库建设在认识上存在的误区是今后长时期的主要话题.本文从数据库建设误区形成的因素、走出数据库建设误区的保障方法以及营造网络信息检索环境等三个方面对这一问题进行探讨,以适应知识经济时代人们对网络信息检索数据的要求.  相似文献   

10.
从文本中抽取信息的过程可粗略地分解为文本分析和信息抽取两个阶段。我们开发了一个原型系统,可以把一个自由文本转换成一个结构化的文本表示,然后就可用于自动建立数据库,以用于信息检索系统。该系统采用了基于结构化关键词的文本分析方法,并用一个结构模板指定描述部位和控制信息的抽取。  相似文献   

11.
针对信息检索角度的XML的结构化检索问题,利用基于倒排文件的方法,使用NEXI作为检索语言,在基于XML的数字图书馆检索实验系统WHU-XML上对其进行实现,并具体分析查询语言的解析方法以及所采用的结构化检索算法。  相似文献   

12.
王志宇 《兰台世界》2016,(23):30-34
本文以半个世纪以来数据库技术的发展为线索,阐述了随数据库技术而研发的各时代电子文件管理系统的特征与可能实现的功能。详细表述了从传统的以保存和应用结构化数据库为核心建设的电子文件管理系统,发展到大数据时代的以非结构化的NOSQL数据库的系统建设。揭示了IT技术与电子文件数据库和系统建设的发展规律。  相似文献   

13.
文献领域主题信息检索应用数据库技术的系统研究是数字图书馆建设的关键之一。 当前,主题信息检索应用数据库技术的研究可在两个方面展开:XML的关系数据库应用研究, XML MARC的信息描述和主题检索。参考文献30。  相似文献   

14.
首先从历史角度考察纸质出版,认为就具体形态而言是以纸为媒介“镌著于版”“印行于世”的行为,其本质是“信息生产与传播”行为。其次指出互联网时代,纸质出版的价值犹在,但基于数据的生产与传播为大势所趋:数据库是面向特定主题,集成的、相对稳定的、具有统一格式的、能反映历史变化的数据集合,数据库建设是将“孤立、静态和碎片化”的文本数据转化为“关联、动态和整体性”的结构化数据工程。最后,以自然灾害类突发事件中的旱灾数据库建设为例,探讨数据库建设的意义,介绍数据库建设的基本步骤,以期为出版业的转型提供新思路。  相似文献   

15.
组织专家的检索系统设计与实现   总被引:3,自引:0,他引:3  
组织专家的检索是当前垂直信息检索研究的热门领域,也是组织信息检索研究的重要内容。本文总结了目前国内外组织专家的检索研究现状,分析了构建组织专家的检索系统的需求和挑战,采用基于相关文档集的归并排序法,利用组织内外的网页和期刊数据库等信息智能识别专家的专长,并基于此设计了从数据资源采集、规整、索引、检索到可视化等整个过程的组织专家的检索系统模型及以武汉大学为例的检索系统平台。  相似文献   

16.
网上信息专题数据库建设   总被引:8,自引:0,他引:8  
网络信息检索的困难使网上信息专题数据库的建设成为数字图书馆建设的一个重要组成部分。总结了网上信息的特点,对现有的基于网络信息的服务模式进行了分析和评价,论证了网上信息专题数据库建设的必要性。重点讨论了网上信息专题数据库的建设思路及其实现方法。  相似文献   

17.
论文介绍徐州非物质文化遗产特色数据库建设的意义和徐州非物质文化保护的现状,着重分析基于方正德赛系统的徐州非物质文化遗产特色数据库建设过程中数据采集、数据加工以及数据发布等各环节的具体工作和流程。论文还详细阐述了数据库建设过程中应注意的问题。  相似文献   

18.
结构化数据长期保存问题探析   总被引:2,自引:0,他引:2  
数字信息长期保存问题研究已成为全世界信息管理领域的研究热点之一,而有关实现结构化数据长期保存则缺乏相应的理论、策略与技术方法。为此,本文对结构化数据长期保存问题进行了粗浅的探讨,并提出了基于元数据的结构化数据长期保存执行框架。  相似文献   

19.
2003年国内外情报学研究新进展   总被引:18,自引:2,他引:18  
文章用基于词频统计的内容分析法分析了2003年国内外情报学研究的热点和新动向。从分析结果得出:信息技术、信息检索、网络、信息服务与用户、数据与数据库、管理与评价、信息系统、知识管理等领域是2003年国内外情报学研究的共同热点。  相似文献   

20.
加强数据库建设,对图书馆行业来说已经不是一个新的话题。从计算机技术开始跻身于图书馆行业,其最直接的切入点就是数据库技术在图书馆的应用。“数据库”的概念原本是计算机行业的专业术语,它是指利用计算机对结构化的数据进行综合管理的一门技术,而图书馆用于揭示文献的目录信息就是一种典型的结构化数据,因此它们相结合的产物就是图书馆的目录型数据库,并成为图书馆自动化建设的主体,取得了显著的成效。但是,随着计算机技术的迅猛发展及其在图书馆的进一步应用,网络化实现,数字图书馆目标的提出,使得传统型的图书馆开始向现代…  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号