首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
对信息检索系统返回结果相关度的改进,一直是信息检索领域重要的研究内容。本文首先引入查询词出现信息的概念,随后给出了查询词出现权重的形式化表示,进而将其与BM25模型结合起来。对于查询词出现权重的计算,本文采用了两种方法,即线性加权方法和因数加权方法。我们通过在GOV2数据集上的实验发现,无论哪种方法,通过加入查询词出现权重,都可以有效的改进检索结果的相关度。实验显示,对于TREC 2005的查询,MAP值的改进达到15.78%,p@10的改进达到3468%。本文所描述的方法已经应用到TREC 2009的WebTrack中。  相似文献   

2.
信息爆炸是当今信息社会的一大特点,如何在海量的信息中有效地找到所需信息因而成为了一个关键问题,语义检索技术是解决这一问题非常有潜力的方法.本文对信息检索中的若干关键问题进行了研究,提出了基于语义处理技术的信息检索模型--SPTIR,该模型主要包括以下关键技术:基于词义消歧的语义查询扩展、基于词汇语义相关性度量的查询优化和基于文档语义相关性的检索结果重排序.最后使用大型测试数据集和多项性能指标对SPTIR模型的检索性能进行了试验评估,实验结果充分验证了SPTIR模型的竞争优势以及该模型采用的各项语义处理技术对提高检索性能所起的积极作用.  相似文献   

3.
基于共现分析的语义信息检索研究   总被引:1,自引:1,他引:0  
提高信息检索系统的用户体验度可以从查询优化的算法和增强可视化展示的研究等方面入手。本文利用文献调研、共现分析和构建本体等方法,设计基于共现分析的语义信息检索和流程,并利用武汉大学图书馆的书目检索系统中"世界考古"类目的数据进行实验分析。经过文献调研发现,目前语义信息检索主要集中在基于本体的查询技术、语义标注问题和语义关系检索等方面的研究,语义信息检索目前只能做到表层相关的检索。构建的基于共现分析的语义信息检索模型包括规范器、分析器和本体构建器三个部分,其中分析器是本模型的核心。经过实验分析发现共现分析可以应用于语义信息检索,并比较得出基于共现分析的语义检索比传统检索更具人性化、引导性。  相似文献   

4.
本文提出了一种新的基于相关反馈的跨语言信息检索查询翻译优化技术,就实现该技术的关键步骤"估计检索词在相关文献集合中的翻译概率"设计了4种不同的算法,并通过伪相关反馈实验比较了这4种算法,验证了查询翻译优化技术的有效性.实验结果显示,4种翻译优化算法都能够提高检索结果的精度,其中基于词对齐的翻译算法相对更优越.此外,查询式的长度和检索主题的特征对不同查询翻译优化算法产生着不同程度的影响.  相似文献   

5.
提出一种新的基于负关联规则与频繁项集挖掘的信息检索系统模型,详细阐述系统模型的设计思想、各模块的功能,以及检索系统实现的三种关键技术(即频繁项集挖掘技术、负关联规则挖掘技术和查询优化扩充技术)及其检索算法。实验结果表明,该检索系统能有效提高和改善信息检索性能。  相似文献   

6.
英汉交互式跨语言检索系统设计与实现   总被引:1,自引:0,他引:1  
针对跨语言信息检索的查询翻译歧义性问题,采用交互式系统开发设计方法,对基于相关反馈的跨语言信息检索技术进行研究和分析,提出一个英汉交互式跨语言信息检索系统,实现用户辅助查询翻译、多级用户相关性判断,以及翻译优化与查询扩展等相关反馈功能,结果明显提高了检索效果。  相似文献   

7.
近年来,基于冗余的仿真问答系统因其轻量性及高效性受到越来越多的关注.与分析法不同的是,冗余法不需要大量的语料库也能得到满意的检索结果.这些方法通常重视全文信息而忽视局部环境,而局部环境往往可能包含了大量关于自然语言问题和答案间语义及语法关系的信息.本文中,我们介绍了一种新的轻量级局部文本分析技术以及实现该技术的Askdragon问答系统.该系统只需向搜索引擎提交一个不太严谨或较为模糊的问题,然后选取小部分高质量的检索结果进行答案抽取即可.问答系统在保持较高精度的同时还显著提升了效率.文章最后使用TREC(Text Retrieval Conference)问题集和四个时间类问题集对该系统进行了评测,评测结果显示系统的性能可以匹敌甚至超越了目前最先进的问答系统,如ARANEA和QUANTA.  相似文献   

8.
问题应答系统QA是当前信息检索领域的研究热点,已连续两年作为TREC会议的主题之一。其核心思想是提供一个以自然语言为主的用户界面,从系统中找出最能反映用户信息需求的答案。将其应用到数字图书馆书,作为用户接口或一个功能模块,将极大提高数字图书馆的检索效率。本文首先介绍了QA技术的现状,然后提出一个基于QA的数字图书馆的架构,并对相关关键技术进行了讨论,最后说明了QA在数字图书馆中的应用前景。  相似文献   

9.
信息检索模型与逻辑理论   总被引:6,自引:0,他引:6  
杨建林 《情报学报》2000,19(5):514-518
本文从另外一个角度讨论信息检索模型。基于逻辑理论,本文定义了一种查询与知识集的等价关系,从逻辑的角度描述了查询与信息检索系统之间的关系、查询与作为检索结果的文献集之间的关系。  相似文献   

10.
认为利用关键词对结构化数据进行查询,实现信息检索和数据库查询的融合的技术已成为热点研究问题。基于模式图的检索算法是目前数据库关键词检索研究的技术之一。现有的模式图算法仍然存在着检索效率低下、查询准确率不高等问题。在对现有算法进行改进的基础上,设计并实现一个基于改进算法的系统,实验表明,使用改进算法的系统具有更高的检索性能和检索效率。  相似文献   

11.
文章旨在探讨查询分类技术和跨语言检索技术的关系,前者的应用能否改善后者的系统性能是核心问题。首先提出一种基于查询分类的标准化折扣累积增量评价指标,通过对采用查询分类技术前后信息检索系统的标准化折扣累积增量评价指标的变化进行判断,来检验该评价指标的可用性和有效性。同时,查询分类可以作为降低跨语言检索系统查询翻译的歧义性的技术手段。对大规模查询集随机抽样的查询翻译实验结果表明,本文提出的基于查询分类的查询翻译消歧方法对大部分查询有效,在一些情况下甚至可以直接通过本方法完成查询翻译。结合其他方法进一步消除翻译的歧义性则是下一步的工作内容。  相似文献   

12.
检索词自动扩展词库构建方法的基本思路是:根据语料是否规范化处理进行词库分类建设,优化了系统的检索性能;结合学科类别,对词库语料进行领域划分,引导科技人员对技术领域的准确把握;建设以本体库为基础,将与规范词具有关联性、相似性的语料通过关系表与关联库关联,把科技文献中的关键词组成一个有序的关系网,解决了传统检索系统中检索词无关联的不足;通过对检索词出现频率进行统计分析,进而更新词库,保证本体库、关联库语料的时效性,突破了人工对词库更新管理的受限性。  相似文献   

13.
特征词抽取和相关性融合的伪相关反馈查询扩展   总被引:2,自引:0,他引:2  
针对现有信息检索系统中存在的词不匹配问题,提出一种基于特征词抽取和相关性融合的伪相关反馈查询扩展算法以及新的扩展词权重计算方法。该算法从前列n篇初检局部文档中抽取与原查询相关的特征词,根据特征词在初检文档集中出现的频度以及与原查询的相关度,将特征词确定为最终的扩展词实现查询扩展。实验结果表明,该方法有效,并能提高和改善信息检索性能。  相似文献   

14.
李毅  庞景安 《情报学报》2003,22(4):403-411
为了提高中文医学信息检索效率,本文应用语义学研究成果,深入剖析统一医学语言系统(UMLS),从理论上对多层次概念语义网络结构进行了探讨,以此设计了适用于中文医学信息特点的三层概念语义网络结构,并分别确定了各个概念语义网络层次的语义类型和语义关系,进一步完善了医学信息语义网络.以信息检索的认知理论为依据,建立了基于三层概念语义网络结构的中文医学信息语义标引体系和语义检索模型.对扩展检索和语义检索进行统计学Kappa检验,认为两种检索方法的一致性非常显著(p<0.01);与扩展检索中的任何一种方法相比,语义检索方法具有更高的检索效率.  相似文献   

15.
信息检索扩展技术研究   总被引:1,自引:0,他引:1  
本文针对信息检索在查询扩展方面的不足,提出了一种结合本体理论和用户相关反馈技术的查询扩展方法。以FirteX作为检索平台, 选取WordNet作为本体扩展资源来验证本文所提出的查询扩展算法,实现结果表明该方法比基于余弦相似性的查询扩展方法在平均查全率、平均查准率方面有更大的优点。  相似文献   

16.
The application of relevance feedback techniques has been shown to improve retrieval performance for a number of information retrieval tasks. This paper explores incremental relevance feedback for ad hoc Japanese text retrieval; examining, separately and in combination, the utility of term reweighting and query expansion using a probabilistic retrieval model. Retrieval performance is evaluated in terms of standard precision-recall measures, and also using number-to-view graphs. Experimental results, on the standard BMIR-J2 Japanese language retrieval collection, show that both term reweighting and query expansion improve retrieval performance. This is reflected in improvements in both precision and recall, but also a reduction in the average number of documents which must be viewed to find a selected number of relevant items. In particular, using a simple simulation of user searching, incremental application of relevance information is shown to lead to progressively improved retrieval performance and an overall reduction in the number of documents that a user must view to find relevant ones.  相似文献   

17.
2006-2007年国外对信息检索基础理论的研究主要集中于决策理论、隐含语义索引理论研究以及信息检索评价理论研究。关于信息检索基本原理的研究主要集中在信息检索中的分类、信息检索模型、信息检索类型和检索方式等方面。信息检索中的分类的研究重点包括有关分类器的研究;有关特征选择的研究;有关领域相关词的研究。信息检索类型的研究主要包括焦点检索、图像检索、视频检索、合作过滤、机器音译、无线网中网。检索方式的研究主要包括上下文检索、集成检索、问答系统检索以及用户查询处理等问题。  相似文献   

18.
多媒体信息检索是根据相似性度量而不是精确匹配技术进行检索的。有效性是测量多媒体检索系统性能的一个主要参数,本文着重介绍了几种常见的有效性度量方法,讨论了各自的优点、缺点和适用性,并给出了一个新的有效性度量方法。  相似文献   

19.
交互式跨语言信息检索是信息检索的一个重要分支。在分析交互式跨语言信息检索过程、评价指标、用户行为进展等理论研究基础上,设计一个让用户参与跨语言信息检索全过程的用户检索实验。实验结果表明:用户检索词主要来自检索主题的标题;用户判断文档相关性的准确率较高;目标语言文档全文、译文摘要、译文全文都是用户认可的判断依据;翻译优化方法以及翻译优化与查询扩展的结合方法在用户交互环境下非常有效;用户对于反馈后的翻译仍然愿意做进一步选择;用户对于与跨语言信息检索系统进行交互是有需求并认可的。用户行为分析有助于指导交互式跨语言信息检索系统的设计与实践。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号