首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
一种支持高效检索的实时更新倒排索引策略   总被引:5,自引:0,他引:5  
李栋  史晓东 《情报学报》2006,25(1):16-20
最近的研究使得搜索引擎中搜取的网页文档与万维网的变化越来越同步。为使用户通过搜索引擎获取网络上的最新信息,必须加快倒排索引的更新。本文介绍了使用界标和增加/删除网页文档两种典型的倒排索引更新策略,并分析了它们的优缺点,提出了一种支持高效检索的实时更新倒排索引策略。这种策略综合了减少更新操作、加快实时更新和缩短用户查询响应时间等方面的优点,较好地适应了当前网络内容变化的特点。最后通过实验对这种策略进行了验证。  相似文献   

2.
从OA解读和OA文档文献资源、利用搜索引擎检索OA文档文献、利用文档搜索软件检索OA文档文献4方面,对开发利用互联网上的OA文档文献资源进行了探讨。  相似文献   

3.
随着互联网上信息数量的不断增长,传统的信息检索技术已经很难满足人们对查询质量的苛刻要求。为了方便用户从检索结果中快速、准确地定位自己想要的信息,集成了文档聚类功能的搜索引擎应运而生。本文讨论了文档聚类技术在搜索引擎中的应用问题,介绍了一些算法,重点分析了Vivisimo这个比较有代表性的聚类搜索引擎,并预测了搜索引擎聚类技术的发展趋势。  相似文献   

4.
Google和百度是世界上最大的搜索引擎,基于这两大搜索引擎之间的特点和区别,对两者的更新时间、响应速度、查全率、检准率、文档搜索等方面进行比较分析。  相似文献   

5.
国外搜索引擎检索效能研究述评   总被引:2,自引:0,他引:2  
在网络搜索引擎的使用中,搜索引擎的检索效能成为影响用户信息获取效果和搜索引擎服务质量的重要因素.目前,国外的相关研究主要采取实验的方法,从用户体验角度出发评价搜索引擎的检索效能,主要步骤包括确定信息需求、选择搜索引擎、评价结果文档相关度以及确定测度指标.最常用的测度指标是查全率和查准率.此外,影响用户检索效能的指标还有搜索引擎返回结果文档的排序质量、重复度,而索引的数量、用户满意度等指标都会影响用户使用的效果.无论是从搜索引擎的用户使用角度,还是用户评价角度,"用户参与"的模式是最贴近检索现实的.  相似文献   

6.
基于Lucene的Ftp搜索引擎的设计   总被引:2,自引:0,他引:2  
针对当前网络中所使用的基于数据库的Ftp搜索引擎没有标准资源文档且不支持中文分词和动态数据更新的缺陷,提出基于Lucene这个功能强大的全文索引引擎工具包的Ftp搜索引擎的设计方案。此Ftp搜索引擎不仅能够自动生成标准格式的XML资源文档,而且采用基于字典的前向最大匹配中文分词法在Lucene中动态更新全文索引。该设计还能够对检索关键字进行中英文混合分析和检索。  相似文献   

7.
博客搜索引擎与传统搜索引擎的比较研究   总被引:8,自引:0,他引:8  
简要介绍了博客与国内外著名博客搜索引擎,针对博客搜索引擎与传统搜索引擎的不同,从工作原理、检索内容与检索方式三个方面对两种搜索引擎进行了系统的分析与比较,并选取了四个不同方面的具有代表性的主题,对两种搜索引擎的代表进行了检索功能和检索性能方面的测评,最后指出了两种搜索引擎在资源价值、检索方式、个性化服务等方面的各自的优势与不足之处,以期对两种搜索引擎的改进提供借鉴。  相似文献   

8.
基于文档聚类的Web辅助浏览研究   总被引:2,自引:0,他引:2  
王勋  刘君强 《情报学报》2004,23(2):168-172
目前的搜索引擎在方便人们查询的同时也存在不足 ,由于它们并非面向某个特定用户服务 ,所以并不能反映用户的个性化需求 ,查询得到的信息往往还是有大量的冗余。为此本文提出了一种基于文档聚类的网络辅助浏览技术。首先给出了模糊概念图的模型来描述词语间的关系 ,然后将Web文档转化为矢量文档表示 ,利用基于K Means聚类方法对矢量文档进行聚类 ,通过确认最终抽取出用户兴趣模式 ,从而辅助用户实现个性化搜索  相似文献   

9.
XML搜索引擎研究   总被引:1,自引:0,他引:1  
首先分析传统搜索引擎查准率不高的原因,然后介绍XML以及XML搜索引擎研究现状,并对XML搜索引擎所涉及的文档存储、索引、查询等关键技术进行详尽探讨。在此基础上,设计现行网络环境下的XML搜索引擎模型。认为该模型可充分利用XML文档的DTD模式信息,并能大幅度提高查询的准确率。  相似文献   

10.
智能搜索引擎信息过滤机制研究   总被引:3,自引:0,他引:3  
智能搜索引擎是人工智能技术和传统搜索引擎技术相结合的产物。面对信息无时无刻不在进行更替的网络环境,智能搜索引擎具有自然语言过滤智能化、多文档处理智能化、用户服务智能化等信息处理机制。为促进智能搜索引擎发展,应重视用户建模技术研究,加强基于多Agent智能搜索引擎系统的研制与实践,加大智能搜索引擎关键技术研究力度。  相似文献   

11.
核电企业搜索引擎系统由于相关领域的专业性,可以将专家用户浏览过的专业领域的文档进行记录,作为专家知识推荐给普通用户,提高搜索引擎的使用效率。本文提出了基于分众分类的核电专家知识推荐算法,帮助普通用户方便、有效地定位到有价值的知识。  相似文献   

12.
本文对现阶段中文搜索引擎的两种主要搜索方式:目录式搜索(即分类搜索)与关键词搜索分别进行了介绍和分析,以网易搜索引擎为例阐述了网站信息标引的三种方式,并分析了网易搜索引擎特色及问题,国内搜索引擎发展前景的问题。 现阶段网络搜索引擎有两种主要搜索方式:目录式搜索(即分类搜索)与关键词搜索 目前因特网上的搜索引擎很明显地可分为两大类,一类是自由词或关键词检索搜索引擎(国外称之为索引搜索引擎Indexing),另一类是分类搜索引擎,即通过分类浏览来查询信息,(国外称之为目录服务Director Service)。 当然这两类搜索引擎的功能是互相借鉴和渗透的。目前的搜索引擎,尤其是中文搜索引擎有互相融合的趋势,关键词搜索引擎与分类搜索引擎通常是我中有你,你中有我,国内的关键词搜索引擎大多又建有一个分类库。一般来讲,我们将由网上机器人(Spider或Robot)自动收集网页建库,而检索又以全文检索为主的搜索引擎归入关键词搜索引擎,而将主要由人工维护建库,以分类导航或分类摘要查询为主的搜索引擎归入分类搜索引擎。以下将按关键词搜索引擎与目录式(分类)搜索引擎两大类型来分别进行一些分析。  相似文献   

13.
传统的Web搜索引擎没有考 虑用户的兴趣爱好,搜索出的信息 量庞大,经常将与用户兴趣不相关 的文档提交给用户。这种现象的发 生可能是由于用户所提交的关键 词意义不够精确造成,也可能是由 于搜索引擎对文档发现和过滤的 能力有限造成的。因此,在信息发 现和过滤的过程中应该考虑通过 智能代理技术来提高检索能力。  相似文献   

14.
通过分析基于本体的语义搜索引擎的研究与开发成果,总结语义搜索引擎的一般架构,并详细分析hakia、Qrobo、Swoogle、Zoominfo、Kango等典型语义搜索引擎的技术解决方案和功能特色,简要总结当前基于本体的语义搜索引擎开发中存在的问题与困难。  相似文献   

15.
基于搜索引擎的数字图书馆智能信息检索   总被引:6,自引:0,他引:6  
智能信息检索的实质和发展方向,是智能搜索引擎技术的不断改进和广泛应用。以智能搜索引擎为中心构建数字图书馆的个性化服务系统,是数字图书馆信息检索的现实需要和大势所趋。文章论述了当前搜索引擎存在的不足及智能搜索引擎的优越性,概述了智能信息检索及其主要解决方案,探讨了智能搜索引擎在数字图书馆个性化服务中的应用。  相似文献   

16.
网络环境下学术信息的开放存取   总被引:55,自引:0,他引:55       下载免费PDF全文
开放存取思想迎合了网络时代信息交流的特点,开创了一种新的、高效的交流模式。开放存取包含两层含义:一是指学术信息免费向公众开放;二是指学术信息的可获得性。网络环境下的学术信息开放存取服务有多种类型,如:在线文档发布、科学家与研究组内部的直接交流、通过电子邮件的自由辩论、搜索引擎的索引与检索服务、第三方集成检索服务等。图3。参考文献10。  相似文献   

17.
严海兵  崔志明 《情报学报》2007,26(3):361-365
基于关键字匹配的搜索引擎排序网页时仅仅考虑评价网页的重要性,而忽视分类;基于分类目录的搜索引擎很难动态分析Web信息。本文在分析它们不足的前提下,提出利用模糊聚类的方法对搜索引擎的检索结果进行动态分类,依据超链分析算法PageRank和Web文档隶属度相结合进行分类排序,并给出具有调节值的结合公式。实验证明,该算法能够更有效地满足用户的需要,提高检索效率。  相似文献   

18.
针对企业文档信息资源丰富而又缺乏有效搜索工具的问题,提出构建企业级搜索引擎。首先分析企业级搜索引擎应具有的功能和总体架构,在实现中,对Lucene索引器进行深入研究;在抓取器的体系设计中,采用插件设计思想,来对不同的文档类型解析、抽取;在任务调度方面,实现一套多任务并行的调度机制;在用户接口设计上,采用Yui-ext组件和DWR远程对象调用框架,实现Web方式下的异步通信,提升用户体验。  相似文献   

19.
2003年8月7日,Adobe公司在上海富豪寰球东亚酒店举行“Adobe Acrobat 6.0中文版发布会暨AdobelnDesign2.0研讨会”,正式推出国内Adobe Acrobat 6.0中文标准版,为国内企业级用户进一步简化作业流程、提高工作效率提供了更加完善的电子文档协作和管理解决方案。作为跨平台文档电子管理解决方案,Adobe Acrobat一直享有“事实工业标准”的美誉,能够轻松实现文档在计算机之间、企业内部网和Web上的协作与共享,突破了电子文档管理的种种局  相似文献   

20.
用户兴趣分类在个性化搜索引擎中的应用   总被引:2,自引:0,他引:2  
个性化搜索引擎是指在普通搜索1引擎的基础上,根据用户的背景,兴趣等调整排序算法,针对不同的用户提供不同的服务.本文对搜索引擎的排序算法和用户行为进行了深入细致的研究,通过隐性方法收集用户行为信息,统计并构建用户长期兴趣模型,短期兴趣模型,时段兴趣模型等,利用向量相似度计算获取最适合用户当前状态的兴趣模型,最后将该兴趣模型结合到搜索引擎的排序算法中,影响文档得分,实现结果集的个性化排序.实验证明,该方法简单有效,可以增加搜索引擎对用户兴趣的应变能力.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号