首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 343 毫秒
1.
王泽贤 《现代情报》2014,34(4):132-136
针对基于Lucene实现中文书目搜索系统的项目中,如何选择最合适的Lucene中文分析器进行了研究。通过大量实验,对Lucene自带的3个分析器及开发活跃度较高的两个第三方中文分析器,从分词效果,建立索引的时间和空间,检索的时间、检全率和平均检准率等方面进行了分析比较。综合实验分析结果,指出ik分析器总体性能最优,为最佳选择。  相似文献   

2.
陶荣  陈燕 《大众科技》2010,(2):19-21
随着因特网的迅猛发展,搜索引擎提供导航服务己经成为互联网上非常重要的网络服务。利用Lucene开源全文本搜索技术框架建立全文检索系统,设计实现了索引器、检索器、中文分析器等模块,完成了一个基于Lucene的搜索引擎的应用,改进后的基于Lucene的全文检索系统能更好地支持中文及更准确地提供给用户所需要的信息。  相似文献   

3.
基于Lucene的信息检索的研究与应用   总被引:6,自引:0,他引:6  
快速有效地索引企业累积的大量的信息资源,是提供高质量检索服务的基础。Lucene是一个用Java写的全文索引引擎工具包,访问索引时间快,支持多用户访问,可以跨平台使用。本文研究了Lucene和中文切分词技术,分析了Lucene的索引原理,实现了一个基于kene并支持中英文文档检索的应用实例。  相似文献   

4.
本文首先简要介绍了 lucene 桌面搜索引擎技术现状,根据桌面搜索的的不足,提出了一种基于 Lucene 的中文搜索引擎设计方案.使用了中文的分词技术的正向最大般配算法解决 lucene 对中文分词存在不足  相似文献   

5.
针对Nutch网页排序算法和中文分词的不足以及单机运行的效率问题,在Nutch综合网页排序中添加用户点击率、网页发布时间以及主题内容相关度3个影响因子,同时添加JE中文分词器,最后利用基于HDFS的HBase技术使Nutch能够实时高效地索引和检索海量数据。通过对实验结果数据的分析发现,Nutch的爬取和索引效率提高了7.93%,用户检索效率与查询准确度分别提高了11.11%与19.51%。  相似文献   

6.
针对传统的基于文本关键字的图像检索方法已经不能满足对大型医学数据库检索的需要的问题,本文提出了一种基于高维特征检索智能算法的图像检索技术。该算法使用高维向量设计基于内容的图像检索,建立训练样本集,根据样本集的距离设置遗传算法的适应度函数,而后遗传迭代出最优向量组合,进行测试集的匹配和检索。算法仿真结果表明,本文提出的基于高维特征检索智能算法的图像检索技术在检索精度上比传统方法高。  相似文献   

7.
基于Lucene的全文搜索引擎的设计与实现   总被引:5,自引:0,他引:5  
Lucene是一个用Java写的全文搜索引擎工具包,支持多用户访问,访问索引速度快,可以跨平台使用。分析了Lucene的索引原理,根据Lucene的系统结构详细分析了Lucene分析器、索引包、文档等结构,实现了一个基于Lucene的中文诗词全文搜索应用实例。  相似文献   

8.
针对XML数据的关键字查询问题,考查了已有的查询技术的优势和不足,提出了基于语义的XML关键字检索算法。对用户输入的关键字进行分类,分为条件关键字和结果关键字。条件关键字只用于限定查询范围,不出现在结果集中。给出了语义相关节点对的概念和判定方法,并提出了基于关键字分类和语义相关节点对的XML数据查询算法。  相似文献   

9.
两种图像检索技术的比较研究   总被引:3,自引:1,他引:2  
张波 《情报杂志》2005,24(2):103-104
目前有两类图像搜索引擎正在研究和使用中 ,即传统的基于关键字的图像检索和基于内容的图像检索。分析了基于关键字的图像检索技术的特点和局限性 ,论述了基于内容的图像检索技术的发展现状与基于关键字的图像检索的区别及MPEG - 7对它的影响 ,并介绍了MIRES系统。  相似文献   

10.
针对ArcGIS在进行地图多图层搜索时速度慢的问题,利用Lucene全文检索的高效性,提出了一种结合Lucene和数据库技术的地图搜索方式,同时为提高空间最临近点查找效率,设计了基于网格模型的查找算法,在此基础上形成智能地图搜索引擎,并在交通地图服务项目的智能搜索功能中得到实现,证明了该搜索引擎的可行性和优越性.  相似文献   

11.
为检索医院的药物信息,本文设计了一种基于Lucene的搜索引擎来收集信息的方法,通过在广州、珠海、武汉三家医院对所需信息进行查询,实现了对药物使用信息的索引、全文检索、高级查询、分词、相关性评分、排序等.引擎搜索结果与手工检索一致.本研究证明:医院内部的医药情报是可以用Lucene搜索引擎来获取的;关于医院药物供应是否充足等问题可依据搜索出的数据情报来回答.  相似文献   

12.
通过对Lucene.Net的深入研究和探索,围绕实现CMS站内搜索功能的目标,探讨了Lucene索引创建、维护和检索功能的实现。  相似文献   

13.
中文Google和百度的排序方式与检索效率比较分析   总被引:1,自引:0,他引:1  
谈大军  林明茵  叶赛 《现代情报》2005,25(3):87-89,92
中文Google和百度是大陆网民最常使用的两个中文搜索引擎,因此对其检索效率的比较分析就显得格外重要。而检索结果的排序是影响检索效率的关键因素。因为根据统计很多网络用户只有耐心看检索结果的前5页。本文在概括介绍目前搜索引擎采用的三种结果排序规则:地点和频率法、人气质量定律、自信心定律的基础上。比较分析了中文Google和百度的排序技术。最后笔者通过检索实践得出结论,中文Google和百度各有所长,但是在检索效率上尤其是检索结果的有效性上,中文Google比百度要好。  相似文献   

14.
首先介绍了基于Internet的搜索引擎的系统结构以及主流搜索引擎的工作原理,在对高性能的爬虫工具包Heritrix和可扩展的Java全文索引工具包Lucene进行系统分析的基础上,设计了整个搜索引擎的构架,并使用Java语言初步实现了"SoEdu"搜索引擎。  相似文献   

15.
「やさしい」「たやすい」「□□」「容易」「□」这几个词都表示容易、简单的意思,属于同义词或近义词,如果仅从中文角度来看,这几个同义词、近义词的使用很难区分,但它们的使用特征明显不同,本文通过具体例句,从意义和用法两方面对它们之间的异同作简明的分析.  相似文献   

16.
针对当前密文搜索领域大多数多关键字查询算法均不能同时保证云环境下的安全性、便捷性,以及实用搜索算法所常见的模糊查询、多关键字查询等操作,本文提出了一种能够适应云计算应用的密文搜索算法,该算法基于MRSE与向量空间模型进行构建,在已有的MRSE的基础上进行了改进,增加了包括分块纠删码、bloomfilter在内的几种优化方案,能够将散落在云端的数据在加密的条件下进行关键字搜索,使得算法搜索性能大大增强。仿真实验结果表明,本文提出的改进的动态模糊多关键字查询算法大大增强了密文搜索的运行效率和安全性,保证了云环境数据的查询准确度,降低了运算和存储的负载,并能够实现多关键字搜索和模糊搜索,增强了云搜索服务的性能,是一种适合云环境应用的密文搜索算法。  相似文献   

17.
耿贞伟  马文  张雪坚 《科技通报》2019,35(7):165-168,173
针对当前现有的密文技术存在的不足进行改进,本文提出一种新的安全密文模糊检索算法,该算法的原理是依据关键词在文档的出现的频率进行关键词语义词库的构建。在进行检索的时候,云服务商可以对用户提交的检索关键词利用算法进行扩展,由扩展得到的关键词进行检索,然后对所检索文档进行相关度的排序,返回结果(用户可以指定结果的数量限制,若是设限,则只返回指定数量的方档)。仿真实验结果表明,本文提出的安全密文模糊检索算法具有良好的关键字检索的效率以及安全性能。  相似文献   

18.
基于本体论的网络信息检索   总被引:3,自引:1,他引:3  
张鼐 《情报杂志》2006,25(4):95-96,99
网络信息的激增和多样化给有效的信息检索带来了种种困难,目前的检索工具仅提供了基于关键字的检索,而忽略了关键字本身所包含的语义内容。针对这些问题,提出了一种基于本体论的网络信息检索方法,该方法可以弥补基于关键字机械匹配检索机制的不足,改善网络信息检索的性能,增强网络信息检索的语义性。  相似文献   

19.
江腾蛟  万常选 《情报杂志》2006,25(10):48-50
研究了XML文档检索的特性,归纳了XML文档模糊检索的结构放松和内容放松的影响因素。在此基础上,设计了模糊结构和内容检索的结果相关性排序模型;并设计了满足这种排序模型的top-K排序算法和搜索引擎的体系结构。  相似文献   

20.
基于本体的语义检索技术研究   总被引:1,自引:0,他引:1  
楚书来  张瑞 《黑龙江科技信息》2010,(24):177-177,176
网络信息的激增和多样化给有效的信息检索带来了种种困难,目前的检索工具仅提供了基于关键字的检索,而忽视了关键字本身所含的语义内容。文章介绍了对本体的认识,以及本体的创建及其推理方法等语义检索的关键技术。详细介绍了基于本体的检索思想以及语义检索系统的体系结构及其构建。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号