首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
邓茹仁  王鹏 《科技广场》2004,(11):11-12
XML文档的结构化连接问题是XML文档查询中的核心问题。XML文档的查询包括两类查询,一类是值的查询,一类是结构的查询。本文通过比较两种基于B 树和XR树的索引技术的XML文档结构化连接算法,说明基于XR树索引的结构化连接算法优于基于B 树索引的结构化连接算法。  相似文献   

2.
乔华 《情报探索》2007,(12):65-68
主要就XML文档的索引方法深入进行研究,并就基于XML文档的结构索引的方法、特点及优势进行分析,提出XML索引机制的改良建议。  相似文献   

3.
贾芳华  王娟 《情报杂志》2002,21(7):31-32
通过分析搜索引擎的标引方法、索引数据库建立和检索的基本原理,指出了导致其检索效果差、查准率低的根本原因在于标引的质量和引得一致性差,建立一定的检索语言规范、实现规范化标引是提高查准率的有效措施。  相似文献   

4.
张冬梅 《情报杂志》2001,20(10):58-59
叙述了XML的由来、XML文档的样式、XML文档的显示及XML文档的应用;认为XML是能够摒弃HTML语言的缺陷,成为未来Web书写工具的标记语方,并且必将推动Web不断发展。  相似文献   

5.
徐文静  崔俊凯 《情报杂志》2005,24(12):65-67,70
研究了一套改进的基于XML架构的关系数据映射索引机制。针对DTD不足,设计了XML Schema算法,完成了关系数据向XML模式的完全转换,并在映射后的XML文档OEM树上运用了一种新的逆波兰链索引技术,同时利用Hash表存储结点指针,实现了查询处理代价的最小化O(n)。  相似文献   

6.
XML相关技术综述   总被引:8,自引:0,他引:8  
本文主要介绍了XML的相关技术,如描述XML文档的UTD和XML schema;转换XML文档的XSLT;用编程方式探作XML的DOM和SAX,并简单介绍了Web Service。  相似文献   

7.
曾瑞 《科技广场》2005,(10):56-59
本文论述了基于VB环境下的XML开发的整体构思,讨论了关于在XML中使用VB开发应用程序的方法,DOM节点树和应用程序操作的使用方法,并用例子说明了VB应用程序利用DOM对XML文档的使用方法.  相似文献   

8.
叙述了XML的由来、XML文档的样式、XML文档的显示及XML文档的应用;认为XML是能够摒弃HTML语言的缺陷,成为未来web书写工具的标记语言,并且必将推动web不断发展.  相似文献   

9.
李剑波  李小华 《情报杂志》2005,24(10):72-74
提出一个带反馈的系统,充分利用XML文档的结构信息,帮助用户构建“有用的”、“感兴趣的”查询式,以便进一步的查询能有较高的准确率。具体的工作是建立路径关键词的倒排索引,在界面方面作了一些扩充,提高了检索系统的易用性。  相似文献   

10.
为了实现对多XML文档管理与操作,本文首先研究多XML文档建立方式和特点,并运用高效便捷的LINQ语言中联合查询语法实现同时对多个XML文档联合操作。该方法能够保证多个XML文档数据的一致性和完整性,便于多个XML文档数据的维护与管理。  相似文献   

11.
韩毅 《情报科学》2003,21(12):1320-1322
数字图书馆在WWW上进行相应的信息展示与提供,基于HTML的文档标记使信息查寻遇到了很大的挑战。本文提出了基于XML的搜索引擎逻辑结构,并对其中的关键技术进行了研究,提出了对XML半结构化文档建立索引和查寻时采用的数据结构和算法,使得数字图书馆在WWW上开展深层次信息提供成为可能,并且也使图书馆原有的MARC信息资源能得到充分利用。  相似文献   

12.
XML在信息检索中的应用初探   总被引:3,自引:1,他引:3  
夏立新 《情报科学》2003,21(9):974-977,1005
本文在分析XML的结构、体系、主要特点、功能的基础上,从文档能够用模式来分类、一些含糊不清的词汇可以用上下文来区分、检索提问可以使用丰富的数据类型、用结构上的临近代替物理上的临近来排列检索结果、将文献中的部分内容作为检索结果予以返回等方面探讨了XML在信息检索领域的应用。  相似文献   

13.
Focusing on the context of XML retrieval, in this paper we propose a general methodology for managing structured queries (involving both content and structure) within any given structured probabilistic information retrieval system which is able to compute posterior probabilities of relevance for structural components given a non-structured query (involving only query terms but not structural restrictions). We have tested our proposal using two specific information retrieval systems (Garnata and PF/Tijah), and the structured document collections from the last six editions of the INitiative for the Evaluation of XML Retrieval (INEX).  相似文献   

14.
韩毅 《情报科学》2006,24(3):409-412
本文以DTD为基础详细讨论了XML文档内客检索的可能性并构建了相应的检索系统,分析了系统的基本模块功能和系统实现的主要技术难点,指出了系统的主要特点和局限。  相似文献   

15.
基于Ajax的交互式检索   总被引:2,自引:0,他引:2  
探讨了Ajax及其技术原理,分析了交互式检索的发展及特点,给出了Ajax在检索中应用的实例。分析了利用Ajax跟踪用户个性化信息的实现方案。在此基础上,提出了基于Ajax的交互式检索系统模型,对模型的主要功能进行了阐述。  相似文献   

16.
Multimedia objects can be retrieved using their context that can be for instance the text surrounding them in documents. This text may be either near or far from the searched objects. Our goal in this paper is to study the impact, in term of effectiveness, of text position relatively to searched objects. The multimedia objects we consider are described in structured documents such as XML ones. The document structure is therefore exploited to provide this text position in documents. Although structural information has been shown to be an effective source of evidence in textual information retrieval, only a few works investigated its interest in multimedia retrieval. More precisely, the task we are interested in this paper is to retrieve multimedia fragments (i.e. XML elements having at least one multimedia object). Our general approach is built on two steps: we first retrieve XML elements containing multimedia objects, and we then explore the surrounding information to retrieve relevant multimedia fragments. In both cases, we study the impact of the surrounding information using the documents structure.  相似文献   

17.
In a hierarchical XML structure, surrounding elements form the context of an XML element. In document-oriented XML, the context is a part of the semantics of the element and augments its textual information. The process of taking the context of the element into account in element scoring is called contextualization. This study extends the concept of contextualization and presents a classification of contextualization models. In an XML collection, elements are of different granularity, i.e. lower level elements are shorter and carry less textual information. Thus, it seems credible that contextualization interacts differently with diverse elements. Even if it is known that contextualization leads to improved effectiveness in element retrieval, the improvement on different granularity levels has not been investigated. This study explores the effect of contextualization on these levels. Further, a parameterized framework for testing contextualization is presented.  相似文献   

18.
在对纸本图书数字化加工过程中,元数据录入是必需的环节,然而手工录入工作量大、效率低,针对这一问题,提出了一种基于机器学习的扫描图书元数据自动获取方法。首先定义元数据的描述、管理和结构元素,然后以扫描页面的DjVu XML文档为数据源,分析页面的格式、结构等特征,以行作为初始特征向量,采用基于有监督的机器学习方法进行元数据抽取,实验表明该算法能够取得较高的准确率和召回率,能够显著的提高图书数字化的效率。  相似文献   

19.
[目的/意义]社会化标注系统为用户检索提供便利的同时也面临一些困扰,标签推荐研究有助于解决资源检索中精确度与召回率之间的两难抉择。[过程/方法]借助网络科学的理论与方法,通过对标签网络的模块化聚类处理获得主题聚类,采用度数中心度对主题聚类内部标签进行排名,根据特定规则选取Top-N标签数量。[结果/结论]实验结果显示,研究中提出的模块化Top-N标签推荐方法,具有可逐层细化的精确度和良好的召回率。该方法的弹性机制可为不同的检索要求提供差异化服务。  相似文献   

20.
彭玉芳  陈将浩 《情报科学》2022,39(1):141-147
【目的/意义】从海量的学术文献内容中,抽取科研人员所需要的目标数据,一方面有助于提高研究者的科 研效率,另一方面有利于改善目前文献数据库的检索服务。【方法/过程】根据科研人员的学术需求,首先通过深度 学习方法从大量的学术文献中抽取目标数据。其次使用NER和TF-IDF抽取目标数据的“5W”规则,接着对目标 数据做第二层需求规则过滤,凡是满足“5W”规则的数据,被鉴定为目标数据。最后对目标数据做第三层人工校 验,最终生成学术文献“目标数据”。【结果/结论】本文构建的学术文献“目标数据”抽取模型的准确率可达0.88,再融 合“5W”规则的过滤和最后的人工校验,不仅有利于提高科研工作者的学术文献查准率,而且一定程度上辅助文献 数据库机构的检索工作。【创新/局限】深度学习与需求规则融合,实现学术文献的检索结果从学术文献的题录信息 层面到进入学术文献内容的数据层面。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号