首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
潜在语义标引(LSI)的提出,使信息检索由传统的基于关键词的检索开始进入基于概念的语义检索阶段,有效提高了信息检索系统的性能。本文在回顾我国潜在语义标引技术的研究成果基础上,分析、总结了我国现有潜在语义标引研究的不足,指出了我国潜在语义标引的进一步研究方向。  相似文献   

2.
本文论述网络环境下中文网页信息的自动标引技术,具体研究分析了面向信息检索的自动分词与词表技术,提出了一个中文网页自动标引的改进方案,以更好地实现中文网络信息资源的自动处理,最后从文档到知识转变的视角,研究第三代网页内容搜索中应用中文信息自动标引的技术问题。  相似文献   

3.
社会标注在网络中的应用越来越广泛,它为信息资源的标引、组织、检索提供了一种全新的模式。国外学者对社会标注的信息标引功能和标引方式、社会标注系统在信息检索中的功用及基于社会标注的信息检索技术等方面进行了研究,取得了一系列成果,但还存在不足之处。该领域的研究趋势在于规范化社会标注的表达,去除标签噪声及垃圾,使标签序化、层级化等。  相似文献   

4.
"对口标引"是文献主题标引工作的一个基本原则.本文从普通用户利用现代图书馆文献信息检索系统的需求特点,对这一标引原则进行了探讨.指出:面向普通用户的计算机信息检索系统,馆藏文献的主题标引应采用适用于普通读者检索技能,并能满足其对不同的专业内容和文献类型阅读需求的"对口标引".  相似文献   

5.
中文自动标引是图书馆学情报学界多年研究的问题并取得了一定成果,其在信息检索数据库研究领域不可或缺。随着全文检索和中文搜索引擎的盛行,中文信息处理有多个学科涉及。中文自动标引、全文检索和中文搜索引擎是什么关系有必要加以明确,以确定其在中文信息处理领域的地位。经探讨认为,全文检索利用了中文自动标引的各种方式,搜索引擎利用了全文检索,因此搜索引擎利用了中文自动标引。中文自动标引、全文检索及中文搜索引擎三者关系是中文自动标引被利用和在技术发展方面相互促进的关系。  相似文献   

6.
主题标引的原理和方法(一)张琪玉(空军政治学院)必须说明,主题标引可分为标题词标引、叙词标引、单元词标引、关键词标引、自由标引等多种,本文仅限于叙词标引。叙词通常称为主题词,故也可称为主题词标引。所谓主题标引,是指用语词标识(即标题词、叙词、单元词、...  相似文献   

7.
自动标引是现代信息检索研究工作的重点之一,论述了自动标引的整个过程中所应该注意的问题,并描绘了自动标引的流程图。  相似文献   

8.
基于词首最长匹配的词典分词和段句分割符表的切分标记分词,构建用于档案信息集成与检索的知识标引环境,然后运用ASPNET分布式技术,研究和开发一个基于知识标引的异构档案数据整合与信息检索系统。  相似文献   

9.
论数字化期刊论文的关键词标引   总被引:1,自引:1,他引:1  
在数字图书馆建设中,数字化期刊作为信息资源贮存和交流的新型载体形式,其论文标引规范控制是实现网络信息资源共享的需要,也是实现用户信息检索的需要。叙述了标引与信息资源检索的关系以及对论文采用关键词标引的方法、基本原则等,并就提高标引质量的问题发表了自己的看法。  相似文献   

10.
在数字图书馆建设中,数字化期刊作为信息资源贮存和交流的新型栽体形式,其论文标引规范控制是实现网络信息资源共享的需要,也是实现用户信息检索的需要。叙述了标引与信息资源检索的关系以及对论文采用关键词标引的方法、基本原则等,并就提高标引质量的问题发表了自己的看法。  相似文献   

11.
试论信息检索途径的多样性   总被引:7,自引:0,他引:7  
有感于平时上信息检索课找不到一泰关于信息检索途径方面的完整资料,于是自己动手归纳。文章在简要介绍信息检索概念和检索原理的基础上,从文献的形式特征和内容特征两个方面提出了多种信息检索途径,如题名途径、著者途径、序号途径、引文途径、“名称”途径、来源途径、关联途径、年代途径、分类号途径、摘要途径、代码途径、主题词途径,主题词途径包括标题词途径、元词途径、叙词途径、关键词途径等等。  相似文献   

12.
中文全文检索技术的研究及实现   总被引:9,自引:0,他引:9  
李梅  王庆林 《情报学报》2003,22(1):10-17
本文设计了一个中文全文检索系统 ,在单汉字全文数据库的基础之上进行了全文检索的算法研究 ,提出了针对特定检索策略的计算公式。同时还对检索结果集的排序问题进行了讨论 ,并采用用户反馈信息量 ,使最后检出的结果在应用中不断得到优化  相似文献   

13.
Information Retrieval from Documents: A Survey   总被引:4,自引:0,他引:4  
Given the phenomenal growth in the variety and quantity of data available to users through electronic media, there is a great demand for efficient and effective ways to organize and search through all this information. Besides speech, our principal means of communication is through visual media, and in particular, through documents. In this paper, we provide an update on Doermann's comprehensive survey (1998) of research results in the broad area of document-based information retrieval. The scope of this survey is also somewhat broader, and there is a greater emphasis on relating document image analysis methods to conventional IR methods.Documents are available in a wide variety of formats. Technical papers are often available as ASCII files of clean, correct, text. Other documents may only be available as hardcopies. These documents have to be scanned and stored as images so that they may be processed by a computer. The textual content of these documents may also be extracted and recognized using OCR methods. Our survey covers the broad spectrum of methods that are required to handle different formats like text and images. The core of the paper focuses on methods that manipulate document images directly, and perform various information processing tasks such as retrieval, categorization, and summarization, without attempting to completely recognize the textual content of the document. We start, however, with a brief overview of traditional IR techniques that operate on clean text. We also discuss research dealing with text that is generated by running OCR on document images. Finally, we also briefly touch on the related problem of content-based image retrieval.  相似文献   

14.
Intelligent Indexing and Semantic Retrieval of Multimodal Documents   总被引:2,自引:0,他引:2  
Finding useful information from large multimodal document collections such as the WWW without encountering numerous false positives poses a challenge to multimedia information retrieval systems (MMIR). This research addresses the problem of finding pictures. The fact that images do not appear in isolation, but rather with accompanying, collateral text is exploited. Taken independently, existing techniques for picture retrieval using (i) text-based and (ii) image-based methods have several limitations. This research presents a general model for multimodal information retrieval that addresses the following issues: (i) users' information need, (ii) expressing information need through composite, multimodal queries, and (iii) determining the most appropriate weighted combination of indexing techniques in order to best satisfy information need. A machine learning approach is proposed for the latter. The focus is on improving precision and recall in a MMIR system by optimally combining text and image similarity. Experiments are presented which demonstrate the utility of individual indexing systems in improving overall average precision.  相似文献   

15.
论第四种情报检索语言系统   总被引:7,自引:0,他引:7  
第四种情报检索语言是自然语言与人工语言结合的一体化语言。第四种情报检索语言系统是一种基于网络的信息检索系统 ,比分类主题一体化情报检索语言系统更高级更新颖 ,是我国 2 1世纪情报检索语言系统研究的方向。加快我国第四种情报检索语言系统研究的关键 ,是解决汉语分词技术问题。参考文献 14。  相似文献   

16.
整合信息素质教育的文献检索课研究   总被引:3,自引:0,他引:3  
文章从信息素质教育与文献检索课的相关性出发,讨论了当前文献检索课存在的问题,探讨与研究了以信息素质教育为重点的文献检索课的设计方案.参考文献5.  相似文献   

17.
信息检索的逻辑模型   总被引:9,自引:1,他引:8  
杨建林 《情报学报》2000,19(4):338-341
本文建立了一个基于逻辑理论的信息检索模型。首先给出信息系统逻辑化的方法,然后借助逻辑程序的不动点语义,定义了查询与文献的相关程度。  相似文献   

18.
主题法在网络信息组织中的应用   总被引:17,自引:0,他引:17  
主题法包括关键词法,标题词法,叙词法等。主题法作为两种主要的情报检索语言之一,其功用在传统的文献检索中已经得到了充分的体现。本文论述了以上三种语言的特点以及在网络信息组织中的应用方法。  相似文献   

19.
研究利用XML文本片段和图像的内容特征(颜色)实现图像的检索。基于XML多媒体数字图书馆检索系统平台WHU-XML,对XML文本和图像构建索引,并在此基础上,采用线性归并法,实现基于XML文本片段的图像检索和基于图像内容特征(颜色)检索的结合。研究结果表明,当文本检索权重大于图像内容检索的权重时,检索效果比只采用单一检索方式时好。  相似文献   

20.
基于Internet的后控制全文检索系统的研究与综述   总被引:11,自引:0,他引:11  
基于自然语言的全文检索已经成为目前主要的信息检索技术。主要论述在Interne环境下,采用后控制检索机制(以后控制词表为代表)如何提高自然语言的检索效率和系统的友好性,并以国内外具有代表性的后控制词表检索系统为例,对该领域的研究状况进行综述性研究。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号