首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 289 毫秒
1.
基于用户信息需求的元搜索引擎的构建   总被引:5,自引:0,他引:5  
韩毅 《图书情报工作》2005,49(1):125-127
针对当前网络搜索引擎未能较多地关注用户需求、查全率与查准率不高、彼此间不兼容的缺陷,提出建立基于用户需求的元搜索引擎,并分析其基本原理,给出其基本结构,讨论其运行机制和关键技术。指出基于用户需求的元搜索引擎可使网络信息资源在一定程度上结构化,实现网络信息资源的自组织,提高网络信息检索的查全率和查准率.  相似文献   

2.
基于语义网的智能搜索引擎在数字图书馆中的应用   总被引:2,自引:1,他引:1  
针对数字图书馆现有搜索引擎检索所出现的检索结果无论是在召回率还是在精确度上都不能令人满意的问题,运用语义网理论和智能搜索引擎相关性理论,指出查全率和查准率不高的原因,并提出一种基于语义网的智能搜索引擎来改善查全率和查准率。  相似文献   

3.
搜索引擎主要性能评价指标体系研究   总被引:27,自引:0,他引:27  
本文探讨了在互联网络环境下的信息检索传统评价指标体系的缺陷和建立搜索引擎主要性能评价指标体系的若干原则 ,提出了“相对查全率”和“相对查准率”的概念和计算方法 ,初步建立了搜索引擎主要性能评价指标体系。  相似文献   

4.
王树梅  金澎  吴慧中 《情报学报》2003,22(5):557-560
如何对索引词加权是信息检索中的一个关键技术。本文针对搜索引擎检索的对象是Web页面这一特点 ,通过分析HTML标签的修饰功能 ,结合传统的tf idf加权公式 ,对网页进行加权索引。实验证明对于精确匹配 ,在查全率较低时系统的查准率有较大的提高。  相似文献   

5.
文献检索的目的是全面准确地为用户提供所需文献,而查全率和查准率是评价和衡量文献检索系统检索效率及功能的两个主要技术指标与重要参数。查全率衡量的是系统检索出与用户相关的文献的能力,查准率衡量的是系统拒绝不相关的文献的能力。对它们二者的研究,早在50年代,也就是在计算机情报检索起步时就开始了。一、影响查全率与查准率的主要因素现在,我国的检索系统是手工检索与计算机检索并存,一般情况下手工检索就能满足用户的需要,而作为评价检索效率的主要指标是以传统的查全率和查准率作为基础。查全率与查准率主要受到标引、检…  相似文献   

6.
网络搜索引擎分类目录检索功能研究   总被引:7,自引:0,他引:7  
搜索引擎是检索网上信息的工具。本文以重要的中文搜索引擎为例,分析了搜索引擎分类目录的特点,指出其检索功能的优缺点,提出提高搜索引擎分类目录检索效率的措施。  相似文献   

7.
多媒体搜索引擎创新比较研究   总被引:1,自引:0,他引:1  
吴江 《图书馆学研究》2012,(5):75-79,70
文章介绍基于文本描述和基于内容的多媒体搜索的工作原理和特点,实证分析不同多媒体搜索引擎的查准率、查全率并分析其特点和原因,创新地提出自动构建多媒体资源的目录层级检索的方法,将目录检索与关键词检索结合起来提高检索效率。  相似文献   

8.
基于领域本体实现全网信息的智能搜索方法研究   总被引:2,自引:2,他引:0  
为了克服基于关键词匹配的传统搜索引擎不能有效处理复杂语义的问题,提出了一种基于领域本体实现面向整个网络空间的信息智能搜索方法.首先研究了支持网络信息搜索的领域本体结构和表示方法;重点研究了基于领域本体对用户的检索关键词进行语义处理技术,并且设计了一个算法提高语义推理效率;探究了自动调用搜索引擎,按照语义处理后的检索表达式完成全网信息搜索的方法.实验证明,本方法在略有提高查准率的同时,显著提高了网络信息搜索的查全率.  相似文献   

9.
针对信息查询中使用关键词查询方案遇到的查全率和查准率不高的情况,使用基于本体的语言标注对信息源进行描述来提高查全率;采用基于本体的语义辨析来提高查准率。基于本体的语义辨析的方法在避免词汇歧义上有较好的成效,在信息搜索中能有效地提高准确率,但同时也存在计算量相对较大、查询反应时间延长等问题。  相似文献   

10.
基于Lucene的Web站点站内全文检索系统的设计与实现   总被引:1,自引:0,他引:1  
曹强 《图书情报工作》2007,51(9):124-126,144
设计一个基于开源检索工具包Lucene的Web站点站内全文检索系统,详述系统的设计思路与体系架构,并对中英文分词和添加文档索引等关键技术给出具体代码和实现步骤;最后对该系统进行简单的性能测试并与通用搜索引擎的检索结果进行查全率和查准率方面的比较。  相似文献   

11.
网络信息检索的检全率、检准率影响因素研究   总被引:5,自引:0,他引:5  
主要介绍信息检索系统评价的两个常用指标--检全率、检准率,从信息源、搜索引擎检索机制、用户与系统的交互过程3方面分析网络环境下影响它们的因素,并对如何克服不良因素,提高检索质量提出一些建议。  相似文献   

12.
基于搜索引擎分类信息的用户查询歧义消减   总被引:1,自引:1,他引:0  
用户在利用搜索引擎进行信息检索时,查询条件往往存在歧义,这导致搜索结果的多样性和冗余性.传统的方法主要是基于语义分析或构建知识库,此类方法在实际应用中的可行性不高.本文基于搜索引擎的分类信息,实现了一个简单有效的分类搜索系统.它首先根据用户的查询条件,将返回的搜索结果进行分类,并以树形目录的形式展示给用户,而后根据用户的点击数据,逐步确定用户的搜索意图,从而达到了查询歧义消减的目的.论文详细介绍了系统的设计思想、架构和工作流程.测试实例表明,该系统可以在一定程度上确定用户的查询意图,为用户返回更加准确的搜索结果.  相似文献   

13.
WWW网络信息资源搜索引擎的研究进展   总被引:6,自引:0,他引:6  
夏旭  李健康  方平 《图书馆论坛》2000,20(5):32-35,68
1994年的杨致远等的YAHOO主题指南拉开了WWW网络信息检索的序幕,使得网络搜索引擎和主题指南的研究成为当前国内外研究的热点,对盂内外搜索引擎的比较研究、开发利用、搜索引擎的质量和性能评价、搜索引擎的选择等,均有大量文献报道,本文从以上几个方面综述其研究进展。  相似文献   

14.
首先概述垂直搜索引擎的有关研究,结合通用搜索引擎分析垂直搜索引擎的一些特点和应用,然后结合实际的开发应用从提高查准率、提高查询速度、提高信息采集效率、控制信息采集质量等角度进行分析和探讨,在实例探讨中结合12580网络信息采集的餐饮垂直搜索原型系统提出信息采集、信息更新、信息抽取等实际应用领域中的若干策略。  相似文献   

15.
传统搜索引擎通常靠抓取全文关键词进行分析,由此带来三大缺陷:缺乏语义描述导致查准率低;检索结果冗余模糊导致检索效率低;检索途径不足。基于DC元数据描述网络资源的优越性,课题组设计了一个基于DC元数据的网络搜索引擎系统DCSE,力图克服传统搜索引擎的上述缺陷。DCSE系统自动抓取含DC描述的Web网页,把DC描述信息存入到数据库,排序索引后提供用户检索。检索界面设计成以15个DC元素为检索项的多项逻辑组合检索,检索结果以各DC元素的描述内容来显示,如标题、创建者、描述、日期等。用户通过多项组合检索提高查准率,并通过清晰的结果显示对所需信息做出快速判断、选择,从而达到提高检索效率的目的。  相似文献   

16.
[目的/意义] 针对当前我国健康类搜索引擎可用性程度较低、用户满意度不高的现状,对3个常用健康类搜索引擎的可用性进行评估,以期促进该类搜索引擎技术的发展,提高信息服务质量。[方法/过程] 从用户视角出发,采用实验研究方法,探讨并比较"有问必答"好大夫在线"和"39健康搜"3个健康类搜索引擎的有效性、效率和满意度。[结果/结论] 3个搜索引擎在系统反应速度和易学程度方面较好,但查准率还有待提高;返回网页虽内容丰富,但同时还存在重复、啰嗦、不严谨等问题。本研究发现,用户对健康信息的主观评价与基于临床证据的评价结果有所冲突,如何调和二者之间的矛盾,建立更为全面且有效的健康信息评价指标体系有待进一步研究。  相似文献   

17.
Measuring Search Engine Quality   总被引:12,自引:3,他引:9  
The effectiveness of twenty public search engines is evaluated using TREC-inspired methods and a set of 54 queries taken from real Web search logs. The World Wide Web is taken as the test collection and a combination of crawler and text retrieval system is evaluated. The engines are compared on a range of measures derivable from binary relevance judgments of the first seven live results returned. Statistical testing reveals a significant difference between engines and high intercorrelations between measures. Surprisingly, given the dynamic nature of the Web and the time elapsed, there is also a high correlation between results of this study and a previous study by Gordon and Pathak. For nearly all engines, there is a gradual decline in precision at increasing cutoff after some initial fluctuation. Performance of the engines as a group is found to be inferior to the group of participants in the TREC-8 Large Web task, although the best engines approach the median of those systems. Shortcomings of current Web search evaluation methodology are identified and recommendations are made for future improvements. In particular, the present study and its predecessors deal with queries which are assumed to derive from a need to find a selection of documents relevant to a topic. By contrast, real Web search reflects a range of other information need types which require different judging and different measures.  相似文献   

18.
为减少元搜索引擎中无效成员搜索引擎返回的大量重复冗余信息、减轻后期结果处理的负担、提高系统的查准率,文章提出一种基于奖励机制的成员搜索引擎调度策略。该策略引入Agent技术,将每个成员搜索引擎Agent对查询的重要程度进行量化管理,选择检索性能最佳的若干成员搜索引擎进行调度。实验结果证明,这种基于奖励机制的成员搜索引擎调度策略在提高查准率、缩短查询时间、减轻元搜索引擎后期的结果处理负担方面,都优于传统的成员搜索引擎调度策略。  相似文献   

19.
The literature shows that students are more likely to begin their search via Google, as it is perceived to be easier and more accessible than other databases or publisher platforms. The invisible web, specifically publisher platforms, is sometimes too difficult for students to access; there are also suggestions that Google Scholar in particular may outperform other paid-for databases. The ease of access and the somewhat misguided notion that Google Scholar has more reliable information than that provided by libraries makes search engines all the more attractive. This culture of searching using a single search box is reflected in the increase in the number of libraries opting for single resource discovery systems such as Summon or Primo, which use a single search covering all the library holdings. The findings suggest that whilst Google Scholar can perform well in some circumstances, it performed only moderately well when compared with LISTA and Summon – the single resource discovery system tested. It was the least successful resource in terms of precision when compared with LISTA, Summon, Emerald and Sage. However, the simplicity of search engines begs the question: will databases and publisher platforms become obsolete? The study concludes that subject specific databases are more effective than search engines, but the complexity of accessing the invisible web is hindering their popularity.  相似文献   

20.
何静  张群 《新世纪图书馆》2012,(1):57-59,90
论文对教育部查新站L08 2005-2010年间受理的国内外查新674件查新委托书的查新来源、查新目的、查新项目隶属学科和领域进行了统计分析,得出我国绝大多数查新站的国内外查新都是一个薄弱环节,尤其是社科类查新少之又少的结论.说明国内外查新尤其是社科查新应给予加强,要建立完善的国内外查新体系,以保证查新的查全和查准率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号