共查询到20条相似文献,搜索用时 171 毫秒
1.
潜在语义标引(LSI)的提出,使信息检索由传统的基于关键词的检索开始进入基于概念的语义检索阶段,有效提高了信息检索系统的性能。本文在回顾我国潜在语义标引技术的研究成果基础上,分析、总结了我国现有潜在语义标引研究的不足,指出了我国潜在语义标引的进一步研究方向。 相似文献
2.
本文论述网络环境下中文网页信息的自动标引技术,具体研究分析了面向信息检索的自动分词与词表技术,提出了一个中文网页自动标引的改进方案,以更好地实现中文网络信息资源的自动处理,最后从文档到知识转变的视角,研究第三代网页内容搜索中应用中文信息自动标引的技术问题。 相似文献
3.
社会标注在网络中的应用越来越广泛,它为信息资源的标引、组织、检索提供了一种全新的模式。国外学者对社会标注的信息标引功能和标引方式、社会标注系统在信息检索中的功用及基于社会标注的信息检索技术等方面进行了研究,取得了一系列成果,但还存在不足之处。该领域的研究趋势在于规范化社会标注的表达,去除标签噪声及垃圾,使标签序化、层级化等。 相似文献
4.
"对口标引"是文献主题标引工作的一个基本原则.本文从普通用户利用现代图书馆文献信息检索系统的需求特点,对这一标引原则进行了探讨.指出:面向普通用户的计算机信息检索系统,馆藏文献的主题标引应采用适用于普通读者检索技能,并能满足其对不同的专业内容和文献类型阅读需求的"对口标引". 相似文献
5.
6.
主题标引的原理和方法(一)张琪玉(空军政治学院)必须说明,主题标引可分为标题词标引、叙词标引、单元词标引、关键词标引、自由标引等多种,本文仅限于叙词标引。叙词通常称为主题词,故也可称为主题词标引。所谓主题标引,是指用语词标识(即标题词、叙词、单元词、... 相似文献
7.
自动标引是现代信息检索研究工作的重点之一,论述了自动标引的整个过程中所应该注意的问题,并描绘了自动标引的流程图。 相似文献
8.
基于词首最长匹配的词典分词和段句分割符表的切分标记分词,构建用于档案信息集成与检索的知识标引环境,然后运用ASPNET分布式技术,研究和开发一个基于知识标引的异构档案数据整合与信息检索系统。 相似文献
9.
10.
在数字图书馆建设中,数字化期刊作为信息资源贮存和交流的新型栽体形式,其论文标引规范控制是实现网络信息资源共享的需要,也是实现用户信息检索的需要。叙述了标引与信息资源检索的关系以及对论文采用关键词标引的方法、基本原则等,并就提高标引质量的问题发表了自己的看法。 相似文献
11.
试论信息检索途径的多样性 总被引:7,自引:0,他引:7
有感于平时上信息检索课找不到一泰关于信息检索途径方面的完整资料,于是自己动手归纳。文章在简要介绍信息检索概念和检索原理的基础上,从文献的形式特征和内容特征两个方面提出了多种信息检索途径,如题名途径、著者途径、序号途径、引文途径、“名称”途径、来源途径、关联途径、年代途径、分类号途径、摘要途径、代码途径、主题词途径,主题词途径包括标题词途径、元词途径、叙词途径、关键词途径等等。 相似文献
12.
中文全文检索技术的研究及实现 总被引:9,自引:0,他引:9
本文设计了一个中文全文检索系统 ,在单汉字全文数据库的基础之上进行了全文检索的算法研究 ,提出了针对特定检索策略的计算公式。同时还对检索结果集的排序问题进行了讨论 ,并采用用户反馈信息量 ,使最后检出的结果在应用中不断得到优化 相似文献
13.
Information Retrieval from Documents: A Survey 总被引:4,自引:0,他引:4
Given the phenomenal growth in the variety and quantity of data available to users through electronic media, there is a great demand for efficient and effective ways to organize and search through all this information. Besides speech, our principal means of communication is through visual media, and in particular, through documents. In this paper, we provide an update on Doermann's comprehensive survey (1998) of research results in the broad area of document-based information retrieval. The scope of this survey is also somewhat broader, and there is a greater emphasis on relating document image analysis methods to conventional IR methods.Documents are available in a wide variety of formats. Technical papers are often available as ASCII files of clean, correct, text. Other documents may only be available as hardcopies. These documents have to be scanned and stored as images so that they may be processed by a computer. The textual content of these documents may also be extracted and recognized using OCR methods. Our survey covers the broad spectrum of methods that are required to handle different formats like text and images. The core of the paper focuses on methods that manipulate document images directly, and perform various information processing tasks such as retrieval, categorization, and summarization, without attempting to completely recognize the textual content of the document. We start, however, with a brief overview of traditional IR techniques that operate on clean text. We also discuss research dealing with text that is generated by running OCR on document images. Finally, we also briefly touch on the related problem of content-based image retrieval. 相似文献
14.
Finding useful information from large multimodal document collections such as the WWW without encountering numerous false positives poses a challenge to multimedia information retrieval systems (MMIR). This research addresses the problem of finding pictures. The fact that images do not appear in isolation, but rather with accompanying, collateral text is exploited. Taken independently, existing techniques for picture retrieval using (i) text-based and (ii) image-based methods have several limitations. This research presents a general model for multimodal information retrieval that addresses the following issues: (i) users' information need, (ii) expressing information need through composite, multimodal queries, and (iii) determining the most appropriate weighted combination of indexing techniques in order to best satisfy information need. A machine learning approach is proposed for the latter. The focus is on improving precision and recall in a MMIR system by optimally combining text and image similarity. Experiments are presented which demonstrate the utility of individual indexing systems in improving overall average precision. 相似文献
15.
论第四种情报检索语言系统 总被引:7,自引:0,他引:7
第四种情报检索语言是自然语言与人工语言结合的一体化语言。第四种情报检索语言系统是一种基于网络的信息检索系统 ,比分类主题一体化情报检索语言系统更高级更新颖 ,是我国 2 1世纪情报检索语言系统研究的方向。加快我国第四种情报检索语言系统研究的关键 ,是解决汉语分词技术问题。参考文献 14。 相似文献
16.
整合信息素质教育的文献检索课研究 总被引:3,自引:0,他引:3
文章从信息素质教育与文献检索课的相关性出发,讨论了当前文献检索课存在的问题,探讨与研究了以信息素质教育为重点的文献检索课的设计方案.参考文献5. 相似文献
17.
18.
主题法在网络信息组织中的应用 总被引:17,自引:0,他引:17
主题法包括关键词法,标题词法,叙词法等。主题法作为两种主要的情报检索语言之一,其功用在传统的文献检索中已经得到了充分的体现。本文论述了以上三种语言的特点以及在网络信息组织中的应用方法。 相似文献
19.
20.
基于Internet的后控制全文检索系统的研究与综述 总被引:11,自引:0,他引:11
基于自然语言的全文检索已经成为目前主要的信息检索技术。主要论述在Interne环境下,采用后控制检索机制(以后控制词表为代表)如何提高自然语言的检索效率和系统的友好性,并以国内外具有代表性的后控制词表检索系统为例,对该领域的研究状况进行综述性研究。 相似文献