共查询到19条相似文献,搜索用时 101 毫秒
1.
2.
3.
对开源全文检索引擎Lucene的系统架构、索引与检索过程、语言分析器进行分析的基础上,针对其对中文只能进行单字切分、双字切分的不足,二次开发基于Lucene中英文语言分析器ZH_CNAnalyzer,并给出一个调用此分析器建立索引与检索的实例。 相似文献
4.
全文检索系统由三大功能模块组成:索引模块、检索模块和存储模块。本文着重分析系统组成和XML数据库的设计、建立倒排索引文件、中文分词等技术难点。同时在此基础之上建立基于Lucene/XML的期刊文献全文检索系统。 相似文献
5.
中文全文检索技术的研究及实现 总被引:9,自引:0,他引:9
本文设计了一个中文全文检索系统 ,在单汉字全文数据库的基础之上进行了全文检索的算法研究 ,提出了针对特定检索策略的计算公式。同时还对检索结果集的排序问题进行了讨论 ,并采用用户反馈信息量 ,使最后检出的结果在应用中不断得到优化 相似文献
6.
全文检索系统中动态索引技术的研究与实现 总被引:6,自引:1,他引:5
分析了传统全文检索系统中静态索引技术的实现,讨论了静态索引技术的优缺点;然后提出来一种动态索引技术,阐述了动态索引技术的原理,并在两个数据库开发平台上给出了动态索引技术的实现。 相似文献
7.
8.
Lucene全文检索的应用及检索效率测试研究 总被引:1,自引:0,他引:1
使用Lucene设计一个全文检索系统,系统由三大功能模块组成:索引模块、检索模块和存储模块.第二部分着重分析PDF数据转换,XML文档设计,索引的分词、建立及效率等技术难点,并对中文分词分析器、索引文件膨胀率、索引影响因子及检索系统并对检索响应时间进行测试.应关注XML数据库的安全性. 相似文献
9.
《全国报刊索引》是目前我国唯一的一家搜集全国各学科报刊杂志篇目的综合性检索刊物,该索引的编制工作长期采用手工方式,检索途径单一。为了改变这种落后状况,今年开始采用电子计算机自动编辑排版,自动编制索引。下面就对该索引微机编辑、排版、检索一体化系统作一简介。 相似文献
10.
唐光前 《现代图书情报技术》2003,(6):50-52
分析了基于 Microsoft Search Service为图书馆自建数据库创建 Web全文检索系统的理由、Microsoft SearchService的索引机制和检索机制 ,并运用 ASP.NET技术给出了一个具体的实现方案 相似文献
11.
12.
针对《中图法》(第四版)电子版中存在的类号比对和类号核对不方便的问题,研制了《中图法》(第四版)辅助分类系统。辅助分类系统具有类目树显示、内容检索、类号参照、类号组配、类号核对等功能,有助于提高分类标引工作的效率,提高文献编目的自动化水平。 相似文献
13.
分析基于Microsoft Indexing Service创建Web全文检索系统的理由及Microsoft Indexing Service的索引机制,并利用Mi-crosoft Visual C#.NET技术给出一个具体实现方案。 相似文献
14.
15.
中文期刊文献通用词标引分析 总被引:1,自引:0,他引:1
通用因素是文献主题的构成因素之一,对主体因素起细分作用。通用词是指那些在专业领域没有独立检索意义的泛指词。在中文期刊文献标引的过程中,通用词的使用对其标引结果产生着重要的影响。文章讨论了通用词标引的一般规则,并以《中国期刊网》中的文献为例,进行抽样统计和实例分析,归纳了通用词标引的错误现象及其原因,并对期刊文献的通用词标引提出了几点改进意见。 相似文献
16.
17.
基于受控词表互操作的集成词库构建研究 总被引:2,自引:0,他引:2
目前,国内外信息领域都在致力于受控词表的互操作研究.本文以教育类数据为例,通过对检索语言互操作技术的研究,借鉴国内外实现不同受控词表之间互操作的经验和方法,建立一个以<中分表>为核心的兼容体系,即建立一个可以不断扩充的集成词库.为了便于浏览和使用词库数据,采用单机模式、XML格式及本体构建工具对词库兼容数据进行可视化显示,进而为用户提供各种服务. 相似文献
18.
郑俭华 《大学图书情报学刊》2012,30(3):53-56
主题标引是指根据文献内容及相关特征,赋予具有检索意义的相应语词标识的过程。《中国分类主题词表(第二版)》的使用,标志着我国图书编目工作进入了一个新的阶段,极大地提高了我国中文图书的分类、主题标引的一体化和文献检索的准确率,以及图书编目的质量和工作效率。同时,对从事标引工作的编目员来说,有了更高的要求,促进了我国文献标引工作向更高水平发展。 相似文献
19.
组配标引是在词表中选择两个及两个以上有形式逻辑关系的词,按照特定规则组成的一组标引词串,用以满足文献多层次、多途径检索的需要。概念组配是文献标引的关键环节。根据参与组配的主题词之间的逻辑关系,概念组配可分为交叉组配、限定组配和联结组配3种基本类型。在实际组配标引工作中,编目员应避免因对新词表不熟悉造成检索词语构成混乱,避免因主题概念转换错误造成粗标、漏标和错标,避免因未遵循专指性标引规则造成切题不当,减少组配标引失误。 相似文献