共查询到20条相似文献,搜索用时 171 毫秒
1.
本文对关键字检索技术和Lucene进行了研究和使用。针对文档库,在使用Lucene引擎及其工具包的基础上,设计了一套简单并且行之有效的近义词关键字检索模型。分析了Lucene自带评分算法,并在原有的基础上提出了改进的相关度排序算法。比较了Lucene自带中文分词器和第三方中文分词器的分词效果,设计了定制化的近义词分词器和近义词词典,实现了近义词查询,提高了Lucene关键字检索的性能。 相似文献
2.
面对Internet超越时空的信息传播功能和海量信息资源,如何高效快捷地从网上获取所需信息开展发明创造,本文从实用的角度介绍有关Internet信息的检索方法及技巧。1、利用查询引擎搜索含有期望信息的站点使用查询引擎要注意以下几点:(1)要掌握网上查询引擎类型。网上查询引... 相似文献
3.
调查分析高校图书馆网站的发展现状,发现高校图书馆网站普遍存在信息不易搜索和利用的问题,指出应该使用全文搜索技术对高校图书馆网站的信息资源进行联合检索.以开源软件Heritrix、Lucene和Htmlparser等为基础,构建一个简单的具有基本功能的高校图书馆搜索引擎,以期为后续的研究打下基础. 相似文献
4.
随着因特网的迅猛发展,搜索引擎提供导航服务己经成为互联网上非常重要的网络服务。利用Lucene开源全文本搜索技术框架建立全文检索系统,设计实现了索引器、检索器、中文分析器等模块,完成了一个基于Lucene的搜索引擎的应用,改进后的基于Lucene的全文检索系统能更好地支持中文及更准确地提供给用户所需要的信息。 相似文献
5.
6.
利用Lucene的全文索引和搜索技术,开发了与ILAS III集成的全文搜索型OPAC系统Bookle。介绍了Bookle的体系结构以及参数管理器、索引器、搜索器、用户接口等的设计与实现。Bookle系统实现了扩展书目信息的自动抓取并使之本地化,扩展了书目检索点,为读者提供了书目记录及其扩展书目信息的任意词全文搜索等服务,弥补了ILAS III OPAC的不足。 相似文献
7.
文章介绍了如何利用FTP搜索引擎和FTP搜索软件,在教育网上检索FTP信息资源,并对所检索到的FTP信息资源的下载和利用的方法作了说明。 相似文献
8.
动态科技信息搜集是情报研究工作的前提和基础,对科技网站的跟踪监视是动态科技信息搜集的常用手段之一,通过及时监测互联网上重要网站的信息来达到信息搜集的目的。垂直搜索是相对通用搜索弓『擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务;将其应用于动态科技信息搜集,可以大大提高情报研究工作的效率。 相似文献
9.
本文分析了正方法,查询修正中的用户信息行为,吸收网页抓取、检索与浏览并重的思想,综合考虑用户Web搜索过程中的行为特点、查询修正所用词汇的可用来源,给出一个新的面向Web搜索的查询修正解决方案. 相似文献
10.
11.
随着网络信息资源的迅速增加和实时更新,如何及时准确地获取所需的有用信息是现代网络信息检索技术需要解决的主要问题。针对现有搜索引擎的不足,设计了一种基于多Agent协作的智能搜索引擎系统模型,结合人工智能的Agent技术与元搜索引擎技术来共同执行检索任务,实现基于用户兴趣的智能化与个性化。提高查询的精度和速度.保证了查全率。并对该系统实现的关键技术作了介绍。 相似文献
12.
针对基于Lucene实现中文书目搜索系统的项目中,如何选择最合适的Lucene中文分析器进行了研究。通过大量实验,对Lucene自带的3个分析器及开发活跃度较高的两个第三方中文分析器,从分词效果,建立索引的时间和空间,检索的时间、检全率和平均检准率等方面进行了分析比较。综合实验分析结果,指出ik分析器总体性能最优,为最佳选择。 相似文献
13.
垂直搜索是针对某一个行业的专业搜索引擎;Lucene是Java编写的全文索引引擎工具包,可以跨平台使用;Heritri。是一个功能强大的开源Web网络爬虫。本文主要探讨Lucene和Heritrix在构建垂直搜索引擎中的应用。 相似文献
14.
Google搜索引擎及其使用方法与技巧 总被引:4,自引:1,他引:4
Google是第二代搜索引擎的典范,其检索技术堪称一流,知名的Yahoo!和国内的网易即采用Google搜索引擎技术。本文从检索的角度介绍了Google搜索引擎及其查询的方法与技巧。 相似文献
15.
Internet已成为全球最丰富的数据源,数据类型繁杂且动态变化,如何从中快速准确地检索出用户所需要的信息是一个亟待解决的问题.传统的搜索引擎基于语法的方式进行搜索,缺乏语义信息,难以准确地表达用户的查询需求和被检索对象的文档语义,致使查准率和查全率较低且搜索范围有限.本文对现有的语义检索方法进行了研究,分析了其中存在的问题,在此基础上提出了一种基于领域的语义搜索引擎模型,结合语义Web技术,使用领域本体元数据模型对用户的查询进行语义化规范,依据领域本体模式抽取文档中的知识并RDF化,准确地表达了用户的查询语义和作为被查询对象的文档语义,可以大大提高检索的准确性和检索效率,详细地给出了模型的体系结构、基本功能和工作原理. 相似文献
16.
[目的/意义]查询式搜索适用于目标明确的提问应答式信息问题,探索式搜索更注重搜索过程的人机交互性、动态性与多面性,两者表现出不同的行为特征。作为搜索行为研究的基本问题之一,相关研究还比较缺乏。论文旨在探究查询式搜索与探索式搜索行为特征的差异,这对于信息搜索系统的功能优化以及指导用户高效获取信息都具有重要的实践意义。[方法/过程]论文以健康信息搜索为例,采用搜索行为实验的方法,通过对录屏数据的分析,从检索策略、学习行为、深度搜索和搜索绩效4个维度对两种搜索行为进行比较。[结果/结论]查询式搜索与探索式搜索在关键词变换数、访问网页数目等6个指标上存在显著性差异,在检索工具选择、查询串长度、搜索结果集的翻页和相关链接搜索4个指标上不存在显著性差异。 相似文献
17.
自1994年第一个Web搜索引擎出现以来,Internet上的查询方式焕然一新。而今,数百个Web搜索引擎已构成Internet的主要查询工具,传统图书情报意义上的检索系统也纷纷Web化,使Web搜索引擎成为当今信息检索的主流形式。搜索引擎实际上是一个专用的WWW服务器,它收集Internet网上成千上万甚至上亿个网页信息.组成庞大的索引数据库。 相似文献
18.
针对情报人员在国防产品情报联合搜索中遇到的问题,提出一种基于国防产品情报本体的多信息整合的搜索方法。该方法采用信息抽取技术自动构建本体实例,运用本体对用户查询请求进行语义分析处理,同时实现了基于该方法的原型系统。 相似文献
19.
基于Linux和Myeclipse 8.6平台,应用Java语言和开源工具Lucene,采用流行框架Struts 2.2,Spring 3.0,Hibernate 3.6开发了合作检索引擎"天涯·比邻",该搜索引擎主要通过用户检索输入与检索历史及当前检索进程的语词相似度计算来识别潜在用户。从合作检索界面、合作检索实现过程和检索轨迹呈现3个方面对"天涯·比邻"搜索引擎进行详细说明,最后讨论本研究相对于一般搜索引擎后控词表机制的主要改进及进一步研究内容。 相似文献
20.
通过对Lucene.Net的深入研究和探索,围绕实现CMS站内搜索功能的目标,探讨了Lucene索引创建、维护和检索功能的实现。 相似文献