首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 140 毫秒
1.
研究将XML文本检索方法应用于长文本环境,并以中文博硕士论文为数据集。对博硕士论文数据集的XML标引、索引、关键词检索和结构化检索分别进行设计和实现,构建一个基于XML的中文博硕士论文检索系统。  相似文献   

2.
研究利用XML文本片段和图像的内容特征(颜色)实现图像的检索。基于XML多媒体数字图书馆检索系统平台WHU-XML,对XML文本和图像构建索引,并在此基础上,采用线性归并法,实现基于XML文本片段的图像检索和基于图像内容特征(颜色)检索的结合。研究结果表明,当文本检索权重大于图像内容检索的权重时,检索效果比只采用单一检索方式时好。  相似文献   

3.
从信息检索流程对XML检索的研究情况进行综述。主要对XML查询语言、XML索引、XML检索排序方法以及XML检索评价4个方面的研究情况进行评述,并对XML检索研究的一些热点领域进行介绍,最后就需要继续深入研究的问题进行简要说明。  相似文献   

4.
Lucene全文检索的应用及检索效率测试研究   总被引:1,自引:0,他引:1  
使用Lucene设计一个全文检索系统,系统由三大功能模块组成:索引模块、检索模块和存储模块.第二部分着重分析PDF数据转换,XML文档设计,索引的分词、建立及效率等技术难点,并对中文分词分析器、索引文件膨胀率、索引影响因子及检索系统并对检索响应时间进行测试.应关注XML数据库的安全性.  相似文献   

5.
农业科技信息智能检索系统中的知识组织*   总被引:1,自引:1,他引:1  
介绍了采用文献计量方法对《中国农业科技文献数据库》中的分类和主题标引进行分析,揭示主题词与类目之间的关系,用于构建农业初级本体。同时,以该初级本体作为检索知识库并利用纯XML数据库技术,建立了农业科技智能检索系统。  相似文献   

6.
王福 《贵图学刊》2009,(4):47-48
对数字图书馆统一检索平台的核心问题进行了介绍,在对XML和WebService介绍基础之上提出了基于XML与WebService相结合的数字图书馆同意检索的总体模型,并对如何利用该模型建立统一检索平台进行实证研究。  相似文献   

7.
XML文献数据库检索系统的建立与实现   总被引:3,自引:0,他引:3  
刘红 《情报学报》2003,22(4):439-444
本文主要论述如何建立和为什么要建立一个完全基于XML的文献数据库检索系统,并就XML数据库的一些相关问题作了简单讨论.  相似文献   

8.
农业科技信息导航知识库及其智能检索系统的构建   总被引:6,自引:0,他引:6  
本文介绍了以中国农业科技文献数据库为数据源,以<中图法>为标准 ,按照对农业领域的词汇和分类进行统计分析及考虑网络用户检索特点的基础上制定的信息组织原则,构建的基于本体论和采用XML结构的农业科技信息导航知识库及其智能检索系统.  相似文献   

9.
元素级XML检索模型构建的关键问题与解决方案研究   总被引:2,自引:1,他引:2       下载免费PDF全文
与传统信息检索不同的是XML要实现元素级的检索,其核心是元素级检索模型的构建。而XML文档内上下文元素的相关性、元素之间信息的重复性以及元素大小的不一性等则是构建模型时面临的核心问题。解决办法是:构建基于BM25元素级XML检索模型,构建基于上下文的元素级XML检索模型BM25E,过滤重复元素,进行可检索元素的选择和太小元素的处理。表1。图1。参考文献19。  相似文献   

10.
图像对象特征值的抽取、存储、转换、显现的实现有多种方法,SIMIIRS系统主要采用了数据库方法和XML方法。文章主要讨论了图像资源的XML描述方法、建立图像信息的XML索引文档,检索XML文档以实现图像信息查询与提供。  相似文献   

11.
XML 语言在数字化图书馆系统中的应用   总被引:2,自引:0,他引:2  
介绍了如何在数字化图书馆系统中运用XML语言的方法。并且说明了XML语言的特性及它与HTML语言的区别。利用韩国虚拟图书馆和信息系统(VINIS)中的一个子系统——基于XML语言的元数据搜索的实验系统来演示XML用法。元数据检索系统包括两个模块:搜索模块和浏览模块。搜索模块允许对储存在Access文件中的元数据进行搜索并且可以用XML语言的形式显示搜索结果,浏览模块允许浏览以XMUXSL文件形式存在的元数据。文章最后讨论了如何在数字化图书馆中更有效的运用XML语言。  相似文献   

12.
This paper investigates the impact of three approaches to XML retrieval: using Zettair, a full-text information retrieval system; using eXist, a native XML database; and using a hybrid system that takes full article answers from Zettair and uses eXist to extract elements from those articles. For the content-only topics, we undertake a preliminary analysis of the INEX 2003 relevance assessments in order to identify the types of highly relevant document components. Further analysis identifies two complementary sub-cases of relevance assessments (General and Specific) and two categories of topics (Broad and Narrow). We develop a novel retrieval module that for a content-only topic utilises the information from the resulting answer list of a native XML database and dynamically determines the preferable units of retrieval, which we call Coherent Retrieval Elements. The results of our experiments show that—when each of the three systems is evaluated against different retrieval scenarios (such as different cases of relevance assessments, different topic categories and different choices of evaluation metrics)—the XML retrieval systems exhibit varying behaviour and the best performance can be reached for different values of the retrieval parameters. In the case of INEX 2003 relevance assessments for the content-only topics, our newly developed hybrid XML retrieval system is substantially more effective than either Zettair or eXist, and yields a robust and a very effective XML retrieval.  相似文献   

13.
Query languages for XML such as XPath or XQuery support Boolean retrieval: a query result is a (possibly restructured) subset of XML elements or entire documents that satisfy the search conditions of the query. This search paradigm works for highly schematic XML data collections such as electronic catalogs. However, for searching information in open environments such as the Web or intranets of large corporations, ranked retrieval is more appropriate: a query result is a ranked list of XML elements in descending order of (estimated) relevance. Web search engines, which are based on the ranked retrieval paradigm, do, however, not consider the additional information and rich annotations provided by the structure of XML documents and their element names.This article presents the XXL search engine that supports relevance ranking on XML data. XXL is particularly geared for path queries with wildcards that can span multiple XML collections and contain both exact-match as well as semantic-similarity search conditions. In addition, ontological information and suitable index structures are used to improve the search efficiency and effectiveness. XXL is fully implemented as a suite of Java classes and servlets. Experiments in the context of the INEX benchmark demonstrate the efficiency of the XXL search engine and underline its effectiveness for ranked retrieval.  相似文献   

14.
XML及其在图书馆和情报检索中的应用   总被引:40,自引:4,他引:36  
与HTML 和SGML 相比, XML 更适合运用于Web 环境, 用以表达信息的语义和结构。XML 将对Web 产生重大影响, 并影响图书馆参与Web 信息资源组织和整理的方式。对HTML﹑SGML 和XML 进行了比较, 阐述了XML 影响图书馆的诸多因素, 并对用于检索XML 文档的情报检索技术和XML 对情报检索的帮助进行探讨。  相似文献   

15.
基于XML的分布式信息检索   总被引:1,自引:0,他引:1  
提出了一种对互联网信息进行分布式信息检索的方法:利用代理程序和XML技术向多个相同类型的网站同时发送检索请求文档并接收它们返回的检索结果文档,经过统一处理后将检索结果显示给读者  相似文献   

16.
本文在比较研究XML的DTD和Schema信息描述机制基础上 ,提出基于Schema模式的XAMC信息描述新方案 ,利用XMLSchema技术定义出MARCAMC数据的若干规则和限制 ,并将MARCAMC数据以一种XML文档XAMC的形式加以处理。最后将该研究付诸于XAMC网上信息发布与检索的实现  相似文献   

17.
INEX是当今信息检索领域最重要的国际评测会议之一.文章通过对INEX 2004年至2010年检索评价项目数量、项目类型、项目任务、测试集的变化,以及对IST 2007年至2010年所关注项目,参与INEX评测的机构的分析,了解XML检索领域的发展方向与趋势,以促进我国科研团队在XML语言检索评价领域更加深入的探索和发展.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号