首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
专业搜索引擎的排序算法研究   总被引:5,自引:0,他引:5  
探讨影响搜索引擎排序的一般性因素:词频和词位置信息、用户行为信息、网页之间的链接信息等,在此基础上针对专业搜索引擎的排序算法,提出主题相关度并结合基础教育搜索引擎进行实验。实验结果表明,专业搜索引擎中主题相关度的适当应用能明显改善排序结果。  相似文献   

2.
浅析数字图书馆搜索引擎的特点   总被引:6,自引:0,他引:6  
数字图书馆是因特网上的信息资源管理模式,将从根本上改变目前因特网上信息分散不便使用的现状。搜索引擎是有效组织网上信息资源供用户利用的工具,用户先连上这些节点,采用主题查询、分类浏览或输入特定关键词的方式获取所需信息资源,检索所需信息。数字图书馆与搜索引擎的结合极大地增强了图书馆的信息检索功能。  相似文献   

3.
搜索引擎以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,本文通过对搜索引擎的相关技术(搜索技术、索引技术、检索技术和接口技术)的关联分析,阐述了搜索引擎为信息检索过程提供的技术服务。  相似文献   

4.
著者通过对具有代表性的搜索引擎在提供金融证券信息方面的性能进行测试与评价,从而得出综合性搜索引擎和专业性搜索引擎在提供信息方面的特征,以期使用户能够根据需要有针对性的选择搜索引擎,提高网上金融证券信息检索的相关性。  相似文献   

5.
当HTML网页信息的搜索引擎红火的时候,另一种搜索引擎也越来越受到人们的欢迎,它就是基于Web的FTP文件搜索引擎。本文研究了当前国内著名的FTP搜索引擎,从功能、数据量、速度等方面进行了统计分析与比较,以期为广大用户在选择FTP搜索引擎时提供参考。  相似文献   

6.
1 搜索引擎及其现实不足 1.1 搜索引擎及其分类 搜索引擎是用于帮助因特网用户查询信息的检索工作,它以一定的策略在因特网中搜集、发现信息,对信息进行理解、提取、组织和处理,并提供给用户,达到信息导航的目的。通常意义上的搜索引擎只是信息检索系统的前端,即面向用户的一面;而整个信息检索还包括系统后端的收集、索引信息等功能模块。从不同的角度来划分,搜索引擎有不同的类型:按其覆盖内容的范围来分,有通用型、专业型和特殊型;按是否有人参与索引来分,  相似文献   

7.
21世纪,以Google为代表的搜索引擎能够通过技术手段帮助用户从互联网上庞大的信息资源库中以最快的速度搜索到自己所需的信息,为用户提供简洁、高效、优质的服舒搜索引擎的出现和广泛应用。给图书馆带来了强大的冲击,如何在搜索引擎环境下赢得图书馆的发展,已成为图书馆界共同关心的重要话题。  相似文献   

8.
万维网搜索引擎的研究   总被引:3,自引:0,他引:3  
随着全球互联网上信息资源的迅速增加,WWW服务器的急剧增加,通过浏览器一步步浏览所需信息已十分不便,为帮助用户在信息的海洋中快速方便地搜寻自己所需的信息,很多机构和个人开发了称为搜索引擎或WWW检索工具的软件,通过采集标引众多网络站点来提供全局性网络资源控制与检索机制,从而帮助用户方便地在网络中准确检索所需信息。WWW网页的迅速增加、搜索引擎数量的增长、各种搜索引擎使用的检索方式日益复杂,使得如何准确选择搜索引擎、如何减轻用户学习与操作负担、如何有效利用各个搜索引擎的集成资源与检索能力就成为制约…  相似文献   

9.
搜索引擎的性能评价   总被引:7,自引:0,他引:7  
在信息飞速增长的网络环境下,对有用信息的查找变得越来越困难,搜索引擎便应运而生,并逐渐发展壮大。论文以用户为导向构建层次分析模型,借此对搜索引擎的评价作简要探讨。  相似文献   

10.
基于元搜索引擎的发展历史和特点,探讨了元搜索引擎对数字图书馆的贡献,同时剖析了元搜索引擎和数字图书馆建设中存在的一些问题,对不同数字图书馆中使用的元搜索引擎进行比较研究,在分析网络虚拟参考服务和用户信息需求行为的基础上,建立了基于网络计量学的个性化信息服务模式,旨在改进数字图书馆的功能、为各种各样的数据库和所有用户提供一站式检索服务.参考文献7.  相似文献   

11.
用户兴趣分类在个性化搜索引擎中的应用   总被引:2,自引:0,他引:2  
个性化搜索引擎是指在普通搜索1引擎的基础上,根据用户的背景,兴趣等调整排序算法,针对不同的用户提供不同的服务.本文对搜索引擎的排序算法和用户行为进行了深入细致的研究,通过隐性方法收集用户行为信息,统计并构建用户长期兴趣模型,短期兴趣模型,时段兴趣模型等,利用向量相似度计算获取最适合用户当前状态的兴趣模型,最后将该兴趣模型结合到搜索引擎的排序算法中,影响文档得分,实现结果集的个性化排序.实验证明,该方法简单有效,可以增加搜索引擎对用户兴趣的应变能力.  相似文献   

12.
[目的/意义] 搜索引擎是用户访问网络资源的重要入口,识别用户搜索策略有助于发现用户搜索的认知规律,让搜索引擎更好地理解用户搜索。[方法/过程] 采用Microsoft顺序分析与聚类分析算法对用户搜索日志中的搜索时间进行分析,识别用户利用搜索引擎时普遍采用的搜索策略,并概括不同类型搜索策略的特征。[结果/结论] 用户在搜索中存在“快速消费”策略、“试探”策略、“探索”策略和“终止与确认”策略,不同策略在搜索时间、浏览次数、用户认知过程等方面表现出明显的差异。  相似文献   

13.
宋秀梅 《晋图学刊》2012,(4):18-20,51
本文分析了高校图书馆搜索引擎应用情况,在此基础上提出了一个将垂直搜索引擎应用于高校图书馆的设计模型,利用垂直搜索引擎的优势和特点为用户提供专业的信息资源,进一步增强高校图书馆的个性化信息服务能力。  相似文献   

14.
毛振鹏  胡滨  代海岩 《晋图学刊》2005,(5):23-25,39
建立搜索引擎质量评价体系可以指导用户进行网络信息检索和网站搜索引擎优化,促进搜索引擎功能的不断升级。搜索引擎质量评价体系中总体定性评价主要是分别对搜索引擎的用户舒适程度、专业程度、智能程度进行总体评价;量化指标评价主要是采用传统检索指标和网络检索指标对搜索引擎进行单项评价。  相似文献   

15.
Transaction logs from online search engines are valuable for two reasons: First, they provide insight into human information-seeking behavior. Second, log data can be used to train user models, which can then be applied to improve retrieval systems. This article presents a study of logs from PubMed®, the public gateway to the MEDLINE® database of bibliographic records from the medical and biomedical primary literature. Unlike most previous studies on general Web search, our work examines user activities with a highly-specialized search engine. We encode user actions as string sequences and model these sequences using n-gram language models. The models are evaluated in terms of perplexity and in a sequence prediction task. They help us better understand how PubMed users search for information and provide an enabler for improving users’ search experience.  相似文献   

16.
智能搜索引擎信息过滤机制研究   总被引:3,自引:0,他引:3  
智能搜索引擎是人工智能技术和传统搜索引擎技术相结合的产物。面对信息无时无刻不在进行更替的网络环境,智能搜索引擎具有自然语言过滤智能化、多文档处理智能化、用户服务智能化等信息处理机制。为促进智能搜索引擎发展,应重视用户建模技术研究,加强基于多Agent智能搜索引擎系统的研制与实践,加大智能搜索引擎关键技术研究力度。  相似文献   

17.
The critical task of predicting clicks on search advertisements is typically addressed by learning from historical click data. When enough history is observed for a given query-ad pair, future clicks can be accurately modeled. However, based on the empirical distribution of queries, sufficient historical information is unavailable for many query-ad pairs. The sparsity of data for new and rare queries makes it difficult to accurately estimate clicks for a significant portion of typical search engine traffic. In this paper we provide analysis to motivate modeling approaches that can reduce the sparsity of the large space of user search queries. We then propose methods to improve click and relevance models for sponsored search by mining click behavior for partial user queries. We aggregate click history for individual query words, as well as for phrases extracted with a CRF model. The new models show significant improvement in clicks and revenue compared to state-of-the-art baselines trained on several months of query logs. Results are reported on live traffic of a commercial search engine, in addition to results from offline evaluation.  相似文献   

18.
搜索引擎日志记录了用户与系统交互的整个过程。对日志文件进行挖掘,可以发现用户进行Web搜索的行为特征与规律,有效改善搜索引擎系统的性能。在对国内外相关研究进行系统梳理和总结的基础上,文章提出了一个Web搜索引擎日志挖掘的研究框架,主要包括日志挖掘的研究内容、数据集的选择方法、数据预处理的方法、不同地域用户行为的特征与比较、如何应用于系统性能的改善等内容。  相似文献   

19.
搜索引擎中Robot搜索算法的优化   总被引:15,自引:0,他引:15  
目前的搜索引擎越来越暴露出不足之处 ,当用户使用搜索引擎时输入特定关键词之后 ,返回的查询结果往往有数千甚至几百万之多 ,而且其中包含大量的重复信息与垃圾信息 ,用户从中筛选出自己感兴趣的网页仍然需要耗费很长的时间。另外一种情况就是 ,Web上明明存在某些重要网页 ,却没有被搜索引擎的robot发现。本文针对这种现象 ,重点讨论搜索引擎中的搜索策略 ,改善搜索算法 ,使Robot在搜索阶段就能够充分处理与Robot频繁交互的URL列表。根据网页的内容、HTML结构以及其中包含的超链信息计算网页的PageRank ,使URL列表能够根据重要性调整排列顺序。初步的试验结果表明 ,本文的优化算法可以较大程度地改进搜索引擎的整体性能  相似文献   

20.
Most current machine learning methods for building search engines are based on the assumption that there is a target evaluation metric that evaluates the quality of the search engine with respect to an end user and the engine should be trained to optimize for that metric. Treating the target evaluation metric as a given, many different approaches (e.g. LambdaRank, SoftRank, RankingSVM, etc.) have been proposed to develop methods for optimizing for retrieval metrics. Target metrics used in optimization act as bottlenecks that summarize the training data and it is known that some evaluation metrics are more informative than others. In this paper, we consider the effect of the target evaluation metric on learning to rank. In particular, we question the current assumption that retrieval systems should be designed to directly optimize for a metric that is assumed to evaluate user satisfaction. We show that even if user satisfaction can be measured by a metric X, optimizing the engine on a training set for a more informative metric Y may result in a better test performance according to X (as compared to optimizing the engine directly for X on the training set). We analyze the situations as to when there is a significant difference in the two cases in terms of the amount of available training data and the number of dimensions of the feature space.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号