共查询到20条相似文献,搜索用时 343 毫秒
1.
针对基于Lucene实现中文书目搜索系统的项目中,如何选择最合适的Lucene中文分析器进行了研究。通过大量实验,对Lucene自带的3个分析器及开发活跃度较高的两个第三方中文分析器,从分词效果,建立索引的时间和空间,检索的时间、检全率和平均检准率等方面进行了分析比较。综合实验分析结果,指出ik分析器总体性能最优,为最佳选择。 相似文献
2.
随着因特网的迅猛发展,搜索引擎提供导航服务己经成为互联网上非常重要的网络服务。利用Lucene开源全文本搜索技术框架建立全文检索系统,设计实现了索引器、检索器、中文分析器等模块,完成了一个基于Lucene的搜索引擎的应用,改进后的基于Lucene的全文检索系统能更好地支持中文及更准确地提供给用户所需要的信息。 相似文献
3.
4.
5.
6.
针对传统的基于文本关键字的图像检索方法已经不能满足对大型医学数据库检索的需要的问题,本文提出了一种基于高维特征检索智能算法的图像检索技术。该算法使用高维向量设计基于内容的图像检索,建立训练样本集,根据样本集的距离设置遗传算法的适应度函数,而后遗传迭代出最优向量组合,进行测试集的匹配和检索。算法仿真结果表明,本文提出的基于高维特征检索智能算法的图像检索技术在检索精度上比传统方法高。 相似文献
7.
8.
9.
两种图像检索技术的比较研究 总被引:3,自引:1,他引:2
目前有两类图像搜索引擎正在研究和使用中 ,即传统的基于关键字的图像检索和基于内容的图像检索。分析了基于关键字的图像检索技术的特点和局限性 ,论述了基于内容的图像检索技术的发展现状与基于关键字的图像检索的区别及MPEG - 7对它的影响 ,并介绍了MIRES系统。 相似文献
10.
11.
12.
通过对Lucene.Net的深入研究和探索,围绕实现CMS站内搜索功能的目标,探讨了Lucene索引创建、维护和检索功能的实现。 相似文献
13.
中文Google和百度的排序方式与检索效率比较分析 总被引:1,自引:0,他引:1
中文Google和百度是大陆网民最常使用的两个中文搜索引擎,因此对其检索效率的比较分析就显得格外重要。而检索结果的排序是影响检索效率的关键因素。因为根据统计很多网络用户只有耐心看检索结果的前5页。本文在概括介绍目前搜索引擎采用的三种结果排序规则:地点和频率法、人气质量定律、自信心定律的基础上。比较分析了中文Google和百度的排序技术。最后笔者通过检索实践得出结论,中文Google和百度各有所长,但是在检索效率上尤其是检索结果的有效性上,中文Google比百度要好。 相似文献
14.
首先介绍了基于Internet的搜索引擎的系统结构以及主流搜索引擎的工作原理,在对高性能的爬虫工具包Heritrix和可扩展的Java全文索引工具包Lucene进行系统分析的基础上,设计了整个搜索引擎的构架,并使用Java语言初步实现了"SoEdu"搜索引擎。 相似文献
15.
「やさしい」「たやすい」「□□」「容易」「□」这几个词都表示容易、简单的意思,属于同义词或近义词,如果仅从中文角度来看,这几个同义词、近义词的使用很难区分,但它们的使用特征明显不同,本文通过具体例句,从意义和用法两方面对它们之间的异同作简明的分析. 相似文献
16.
针对当前密文搜索领域大多数多关键字查询算法均不能同时保证云环境下的安全性、便捷性,以及实用搜索算法所常见的模糊查询、多关键字查询等操作,本文提出了一种能够适应云计算应用的密文搜索算法,该算法基于MRSE与向量空间模型进行构建,在已有的MRSE的基础上进行了改进,增加了包括分块纠删码、bloomfilter在内的几种优化方案,能够将散落在云端的数据在加密的条件下进行关键字搜索,使得算法搜索性能大大增强。仿真实验结果表明,本文提出的改进的动态模糊多关键字查询算法大大增强了密文搜索的运行效率和安全性,保证了云环境数据的查询准确度,降低了运算和存储的负载,并能够实现多关键字搜索和模糊搜索,增强了云搜索服务的性能,是一种适合云环境应用的密文搜索算法。 相似文献
17.
18.
基于本体论的网络信息检索 总被引:3,自引:1,他引:3
网络信息的激增和多样化给有效的信息检索带来了种种困难,目前的检索工具仅提供了基于关键字的检索,而忽略了关键字本身所包含的语义内容。针对这些问题,提出了一种基于本体论的网络信息检索方法,该方法可以弥补基于关键字机械匹配检索机制的不足,改善网络信息检索的性能,增强网络信息检索的语义性。 相似文献
19.
研究了XML文档检索的特性,归纳了XML文档模糊检索的结构放松和内容放松的影响因素。在此基础上,设计了模糊结构和内容检索的结果相关性排序模型;并设计了满足这种排序模型的top-K排序算法和搜索引擎的体系结构。 相似文献
20.
基于本体的语义检索技术研究 总被引:1,自引:0,他引:1
网络信息的激增和多样化给有效的信息检索带来了种种困难,目前的检索工具仅提供了基于关键字的检索,而忽视了关键字本身所含的语义内容。文章介绍了对本体的认识,以及本体的创建及其推理方法等语义检索的关键技术。详细介绍了基于本体的检索思想以及语义检索系统的体系结构及其构建。 相似文献