共查询到19条相似文献,搜索用时 234 毫秒
1.
2.
本文通过加权检索与逻辑检索的比较分析和引入负值权数的概念, 论述了在计算机情报检索中加权法提问式与提问逻辑式在表达意义上的可等价性, 并提出了合理确定权数的一种简便方法。文中还侧重论述了加权检索在采用顺排文档与倒排文档检索中的实现方法。 相似文献
3.
4.
针对信息检索角度的XML的结构化检索问题,利用基于倒排文件的方法,使用NEXI作为检索语言,在基于XML的数字图书馆检索实验系统WHU-XML上对其进行实现,并具体分析查询语言的解析方法以及所采用的结构化检索算法。 相似文献
5.
本文提出分离重复字段和实现快速检索的方法,讨论两种倒排文档的时空效益及互相转换问题,在DBASEⅢ上用过波兰变换和横式集合算法实现重复字段倒排文档的检索。 相似文献
6.
苏新宁 《现代图书情报技术》1991,7(1):53-55
本文对dBASE—Ⅲ存在的某些局限性,即不能对多主题字段进行有效的检索以及缺少组配检索功能进行了探索研究,并给出了在dBASE-Ⅲ下实现布尔逻辑检索的算法.该算法以逆波兰方法为基础,并从dBASE-Ⅲ本身存在的优劣出发,对原逆波兰算法作了许多改进,以利于dBASE-Ⅲ对新算法的实现。 相似文献
7.
倒排文档检索的优化算法探讨 总被引:1,自引:0,他引:1
本文就倒排文档检索提出一种新颖的算法──二项拆分法。此法直接根据运算项的运算先后次序进行检索,避开了常用的福岛算法,对倒排文档检索算法的改进与优化作了一种崭新的尝试。 相似文献
8.
9.
10.
11.
张爱红 《现代图书情报技术》2004,20(8):61-65
倒排文档是信息检索系统中最普遍使用的索引机制,而索引文件的压缩能大大提高检索速度和节约磁盘空间。倒排文件压缩的传统做法是文档(标识号)间距法(d-gaps)。然而,剧烈变化的间距值并不能被著名的前缀自由代码有效编码压缩。为了使间距值得到有效的压缩,本文设计了一个文档标识号重置法。模拟试验表明能更有效压缩d-gaps倒排文档。 相似文献
12.
Adding Compression to Block Addressing Inverted Indexes 总被引:8,自引:1,他引:7
Gonzalo Navarro Edleno Silva de Moura Marden Neubert Nivio Ziviani Ricardo Baeza-Yates 《Information Retrieval》2000,3(1):49-77
Inverted index compression, block addressing and sequential search on compressed text are three techniques that have been separately developed for efficient, low-overhead text retrieval. Modern text compression techniques can reduce the text to less than 30% of its size and allow searching it directly and faster than the uncompressed text. Inverted index compression obtains significant reduction of its original size at the same processing speed. Block addressing makes the inverted lists point to text blocks instead of exact positions and pay the reduction in space with some sequential text scanning.In this work we combine the three ideas in a single scheme. We present a compressed inverted file that indexes compressed text and uses block addressing. We consider different techniques to compress the index and study their performance with respect to the block size. We compare the index against three separate techniques for varying block sizes, showing that our index is superior to each isolated approach. For instance, with just 4% of extra space overhead the index has to scan less than 12% of the text for exact searches and about 20% allowing one error in the matches. 相似文献
13.
在电子文件管理元数据中,主题元素存在着3种语义结构:无级次语义结构,有级次语义结构,多级次语义结构。由此也就形成3种不同的XML语法结构。基于XML电子文件管理元数据的主题元素的语义结构设计,不能忽视XML检索功能的需求分析。表8。参考文献5。 相似文献
14.
任树怀 《现代图书情报技术》2004,20(7):41-44
Winisis是一个先进的信息存储与检索软件,由联合国教科文组织开发、维护和免费向世界各国推广,由于采用独特的数据库结构和倒排文档等关键技术,它在可变长记录处理和快速检索等方面具有很强的功能。本文对该软件的关键技术进行了深入研究和剖析。 相似文献
15.
方洁 《现代图书情报技术》2004,20(2):87-88
在信息技术中,将每条记录的中文可检词或标题、内容经过独特处理,做成“全息压缩码”做为唯一标识。该技术运用在计算机文献检索系统中可大大提高检索速度,优化空间配置,广泛用于倒排文档、查重、记录对比等多个领域。 相似文献
16.
Various parallel logical inference algorithms based on the resolution principle are studied. Experimental study was performed on computer systems with shared memory and a cluster. The results we describe show how the architecture and features of computer systems, granularity of parallelism and heuristics influence the efficiency of parallel inference. 相似文献
17.
基于文档结构的向量空间检索模型研究 总被引:9,自引:0,他引:9
分析了传统向量空间检索模型在网络信息检索中的不足 ,给出了基于文档结构的向量空间检索模型。该模型将文档在逻辑上分成N段 ,依据特征项对文档内容代表能力的不同 ,选择有限的最能代表逻辑段内容的特征项构造文本逻辑段的特征项向量与权值向量 ,并以此为基础计算文档与提问的匹配相似度值 ,从而决定匹配文档的检出与排列顺序。进行了两种模型算法时间复杂度的比较分析 ,讨论了改进模型的可能应用前景和存在问题。 相似文献
18.
舆图档案在中国历史上具有强烈的政治和伦理色彩,被统治者视为权力象征和统治利器,而如今舆图档案更多发挥工具价值,为历史重构、路线规划、城市记忆提供参考与凭证。文章选取数字人文为视角,通过行为调查方法将目前舆图档案应用模式归纳为资源提取型模式、片段优化型模式、古今融合型模式、社群自建型模式,分析出发动主体亟须联合、舆图档案潜力有待挖掘、公众参与程度急需提高等结论,最后针对现阶段舆图档案应用模式中困境,选择Anne Burdick提出的与数字人文开发层次构建密切相关要素--资源、技术、组织、人文为向度构筑舆图档案开发层次。 相似文献
19.
张承庆 《现代图书情报技术》1993,9(3):14-18
本文详细介绍了中国专利信息检索系统的运行环境、系统结构、检索功能和信息内容及其格式。该检索系统选用 VSAM文件管理系统实现 ,在建库、更新、检索功能的实现和检索性能的提高方面都有其特点。 相似文献