首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 0 毫秒
1.
统计分析法自动标引的改进研究   总被引:2,自引:0,他引:2  
统计分析法自动标引是自动标引的一种重要方法。本文从标引词应反映文献主题内容这一原则出发,对统计分析法自动标引从标引源的确定、权值的设计、词频的调整及检索后控词表的设计与维护等方面提出了一些改进设想。通过这些方法使标引词更好地反映文献主题的同时提高检索效率。  相似文献   

2.
文献信息自动标引研究   总被引:12,自引:0,他引:12  
作者认为我国文献自动标引研究的重点应由分词研究向实际标引研究转移。由此, 作者从标引源的确立、标引词权值的定义和使用、标引词库的构造、自动标引算法的实现等方面阐述了他们在自动标引方面的研究成果, 同时介绍了利用标引词库进行的检索改造。  相似文献   

3.
刘红光 《中国索引》2006,4(3):43-44
中国地质文献数据库是人工主题标引,它的优点主要是具有概念性、思维性,能够把文献主题内容、主题思想反映出来。本文从地学文献的金属矿床成因类,地质灾害类,石油地质类,举例阐述其常用标引词和标引方法。  相似文献   

4.
生物学文献自动标引系统的理论和实践   总被引:4,自引:0,他引:4  
韩客松  王永成  王刚 《情报学报》2000,19(3):259-264
在统计分析生物学中文文献的一些特点和手工标引的经验的基础上 ,本文介绍了以文献标题和摘要为标引源的自动标引方法。文章着重介绍了折半匹配的抽词和基于非线性加权体系的标引词抽取的理论和实践。  相似文献   

5.
针对中文学术文献,提出一种新的自动标引方法,该方法基于文献之间的引用关系,利用被引文献的标引词,对遗传算法进行改进,实现自动标引,避免利用文献正文、标题等内部文本特征进行自动标引的局限性。通过在大规模真实测试集(中文学术文献)上进行实验,验证该方法的有效性。  相似文献   

6.
LSI潜在语义标引方法在情报检索中的应用   总被引:9,自引:2,他引:7  
介绍了一种基于词相依性的语义结构, 被称为“潜在语义标引”的文献自动标引和检索技术。采用词频统计和奇值分解技术来捕捉文献的语义结构, 得到标引词、提问和文献的向量表示, 检索系统可以预测文献与提问之间的相关度, 达到检索的目的。  相似文献   

7.
文章对数字图书馆领域的文献出版和标引模式进行了探讨,通过对核心期刊和最重要标引词的确认阐述了这一新兴领域的最新发展动态。  相似文献   

8.
隐性语义标引是一种基于词的相依性和语义结构的文献自动标引和检索技术,它采用词频统计和奇值分解技术来捕捉文献中的语义结构,进而得到标引词、提问和文献的向量表示,检索系统就可以通过计算文献与提问之间的相似度,来达到检索目的。相关反馈是通过反复与用户交互,分析调整检索策略,控制检索词的重要程度,从而增强对相关文献的响应且有效地抑制非相关文献的出现的对检索性能加以改进的有效措施。本文描述了相关反馈的数学基础及其在隐生语义标引方法中的工作原理,并以系统论和控制论的基本理论为指导,建立了一个具有相关反馈机制的隐性语义标引方法实验系统,进行了  相似文献   

9.
讨论计算机辅助标引文献加工系统中自然语言词表系统的建立过程。基于海量文献人工标引,运用计量分析法对多年来积累的人工标引词从词频、词长、词类型、词共现等多方面进行分析,重点阐述运用字面相似度计算词间关系来建立适用于机标和后控词表的自然语言词表的过程。  相似文献   

10.
宋芸芳 《图书馆建设》2012,(3):52-54,57
组配标引是在词表中选择两个及两个以上有形式逻辑关系的词,按照特定规则组成的一组标引词串,用以满足文献多层次、多途径检索的需要。概念组配是文献标引的关键环节。根据参与组配的主题词之间的逻辑关系,概念组配可分为交叉组配、限定组配和联结组配3种基本类型。在实际组配标引工作中,编目员应避免因对新词表不熟悉造成检索词语构成混乱,避免因主题概念转换错误造成粗标、漏标和错标,避免因未遵循专指性标引规则造成切题不当,减少组配标引失误。  相似文献   

11.
本文对公文与档案著录标引主题词和主题词标引在公文与档案检索中的重要作用作了阐述,对目前在主题词标引中存在的问题以及对检索产生的影响作了分析,提出了一些对策和值得思考的问题。  相似文献   

12.
关键词是科技论文的文献检索标识,能反映文章主题概念的词或词组,关系到文献的被检索利用情况。文章从关键词的选取范围、选取原则以及首标词的选择三个方面,探讨了如何合理选择关键词,并就关键词标引中存在的漏标、错标、复标问题进行阐述。  相似文献   

13.
In this paper, a novel neighborhood based document smoothing model for information retrieval has been proposed. Lexical association between terms is used to provide a context sensitive indexing weight to the document terms, i.e. the term weights are redistributed based on the lexical association with the context words. A generalized retrieval framework has been presented and it has been shown that the vector space model (VSM), divergence from randomness (DFR), Okapi Best Matching 25 (BM25) and the language model (LM) based retrieval frameworks are special cases of this generalized framework. Being proposed in the generalized retrieval framework, the neighborhood based document smoothing model is applicable to all the indexing models that use the term-document frequency scheme. The proposed smoothing model is as efficient as the baseline retrieval frameworks at runtime. Experiments over the TREC datasets show that the neighborhood based document smoothing model consistently improves the retrieval performance of VSM, DFR, BM25 and LM and the improvements are statistically significant.  相似文献   

14.
从文献检索到信息检索最大的变化 :一是由文献单元向信息单元为基础的组织方式的改变 ;二是由手工分类、主题标引、著者标引经过机器的主题词、自由词抽取、标引发展到全文标引乃至超文本检索。网络技术、超媒体技术和智能技术等是促其变化的关键。作为一门学科的教学必须创建以CAI课件为主导的实践教学方法和建立信息检索课程的基本框架体系。参考文献 4。  相似文献   

15.
文本检索的潜在语义索引法初探   总被引:5,自引:0,他引:5  
传统的文本检索方式是基于提问集合和文本集合的单纯语词匹配检索,然而这并不能解决检索实践过程中存在的同义和多义问题。文章阐述了文本检索的潜在语义索引法的原理并通过实验来验证潜在语义索引可以用来解决同义和多义问题,完善检索系统的性能。  相似文献   

16.
主题标引是指根据文献内容及相关特征,赋予具有检索意义的相应语词标识的过程。《中国分类主题词表(第二版)》的使用,标志着我国图书编目工作进入了一个新的阶段,极大地提高了我国中文图书的分类、主题标引的一体化和文献检索的准确率,以及图书编目的质量和工作效率。同时,对从事标引工作的编目员来说,有了更高的要求,促进了我国文献标引工作向更高水平发展。  相似文献   

17.
《归档文件整理规则》出台后,档案以“件”为单位,实现文件级管理,公文主题词作为档案的重要检索途径之一,相应地也应改革原有的标引方法,使之符合档案管理和现代化检索的要求。  相似文献   

18.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号