首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
针对实践中查词效率和查目效率难以兼顾的两难问题,提出运用概括性强的类称词替代下属的大量特称词,以控制词表的规律;允许各文献情报机构在标引时根据需要将被替代的专指性强的特称词作为类称词的标识词使用,以控制检索系统中相同主题词款目的数量。  相似文献   

2.
通过模糊集合检索模型的规范描述,本文首先定义了检索系统中检索效率和系统效率之间的函数关系,并应用该函数关系对比分析模糊集合检索系统和标准布尔检索系统的性能,指出模糊集合检索系统所面临的"囚徒困境":检索效率的提升引起了系统效率的下降.之后针对"囚徒困境",从词词关联矩阵方面来改进模糊集合检索策略,寻求到解决"囚徒困境"的思路和技术手段.最后借助SQL语言演示词词关联矩阵的两种构造策略,建立数学模型分析词词关联矩阵构造的最优时机,并确立该思路为一种新的系统开发模式.根据时机来合理选择词词关联矩阵构造策略有助于改善现有模糊集合检索算法的执行效率,实现检索效率和系统效率的双赢.  相似文献   

3.
传统上,检索系统利用基于词语共现分析所生成的自构造词表,即词词关联矩阵来实现模糊检索,这种方式生成的词表存在词间关系单一、语词假相关、词义控制差等问题.本文结合传统叙词表,对自构造词表的词间关联度算法进行了改进,新算法丰富了词间关系类型.实证分析表明,新算法有助于提升系统的检索效率.本文首先阐明词间关联度现有算法及关系数据处理方式,并指出现有算法存在的问题,然后引入叙词表控制机制,针对四种词间关系控制情形提出了各自的词间关联度改进算法.最后通过集合从理论上分析改进算法和现有算法,并借助语词关系网实证改进算法对语词关系网的关联性的影响.  相似文献   

4.
中文截词检索对主题词词汇控制的影响   总被引:2,自引:0,他引:2  
对汉语词组性主题词的结构特征和同义词、准同义词的词形特点进行了归类分析,指出截词检索技术的应用可以适度提高词汇的先组度,放宽对字面部分一致的一类同义词、准同义词的控制,而不影响检索效率,适用面向普通用户的情报检索系统  相似文献   

5.
杜慧平 《图书情报工作》2016,60(21):122-127
[目的/意义] 提出一种新的词族识别方法,用于构建语义工具和辅助检索扩展,以降低编表专家的认知负担,提高语义工具构建和更新的效率。[方法/过程] 首先通过同现统计和相似度计算建立学科领域的概念语义网络,再利用社会网络分析中的Island算法进一步识别该网络中的词族。并以金融学科为例,比较该方法与层次聚类算法、“词素后方一致”方法识别词族的效果。[结果/结论] 结果发现,Island算法的效果优于层次聚类算法,并与“词素后方一致”方法各具优势,可以结合使用,取长补短。  相似文献   

6.
本文讨论了选择合适检索词的重要性以及常用的选择检索词的途径,指出为了向用户提供一个良好的检索环境,联机扩展功能应是联机检索系统的重要组成部分。文中以同济情报检索网络系统(TJIRNS)为例,论述了典型环境中联机扩展功能及其实现过程。  相似文献   

7.
[目的/意义] 从术语释义角度出发,探讨叙词表编制过程中词间关系的构建方法。[方法/过程] 叙词表的词间关系主要有等同关系、等级关系和相关关系三种。从术语释义角度出发,对术语释义模式进行分析,并提出基于术语释义分析获取等同关系、等级关系和相关关系的方法。最后,从术语的多义性和释义的可变性对该方法进行讨论。[结果/结论] 通过术语释义获取词间关系,能够使词间关系更符合逻辑,有利于叙词表进行语义控制。  相似文献   

8.
基于Internet的后控制全文检索系统的研究与综述   总被引:11,自引:0,他引:11  
基于自然语言的全文检索已经成为目前主要的信息检索技术。主要论述在Interne环境下,采用后控制检索机制(以后控制词表为代表)如何提高自然语言的检索效率和系统的友好性,并以国内外具有代表性的后控制词表检索系统为例,对该领域的研究状况进行综述性研究。  相似文献   

9.
相关反馈是近年来信息检索领域的研究热点,是自动查询扩展中的一种重要形式,相关反馈主要包括检索词加权和检索词选择。本文介绍了在相关反馈技术中经典的检索词排序算法,对它们带来的性能改进做了比较,并提出了相关反馈的实际应用中需要解决的一些问题。  相似文献   

10.
基于词索引的中文全文检索关键技术及其发展方向   总被引:2,自引:0,他引:2       下载免费PDF全文
基于词索引的中文全文检索的研究是一个涉及到多个领域的综合性课题。汉语自动分词的精度和速度、词索引数据库的结构、词汇控制技术、检索匹配机制等是影响中文全文检索效果的关键因素。目前基于词索引的中文全文检索技术还在分词技术、网络信息标引的准确率、查全率、查准率以及查询方式上存在局限。未来的中文全文检索将最终在语义、语用、语境层次上实现智能化的信息检索。  相似文献   

11.
由于国内中文名称主题和名称规范数据各自创建和维护,彼此并无必然联系,从而产生诸多问题,如词形差异、结构形式差异、数据内容差异、增词(名称)差异等.因此,名称主题和名称规范宜采用合并统一建库的控制模式,解决好名称主题增词、名称复合主题词的编制标准、名称主题与名称规范差异等问题,以处理好名称主题与名称规范的关系.  相似文献   

12.
This study analyzes the Library of Congress (LC) class numbers and the LC subject headings which LC has assigned to 164 works of history and criticism of literature (belles lettres) related to women's studies. These books were classed in more than one hundred different class numbers and spans of numbers. Less than half of these books were assigned to class numbers in PA-PT whose captions contain either the word "women" or another word which points to women's studies, but slightly more than half were assigned "literature" subject headings which contain the words "women," "feminism," "feminist," or "sex role." The subject heading "Women in literature" was assigned to forty of these books, while the words "women authors" appear in a series of different subject headings assigned to forty-five of these books.  相似文献   

13.
统计分析法自动标引的改进研究   总被引:2,自引:0,他引:2  
统计分析法自动标引是自动标引的一种重要方法。本文从标引词应反映文献主题内容这一原则出发,对统计分析法自动标引从标引源的确定、权值的设计、词频的调整及检索后控词表的设计与维护等方面提出了一些改进设想。通过这些方法使标引词更好地反映文献主题的同时提高检索效率。  相似文献   

14.
本文主要对分类主题一体化词表的理论及研制进行述评,包括分类主题一体化研究的发生与发展、分类主题一体化概念、分类法与主题法结合一体的理论及我国检索语言词表研制的发展进程和发展趋势。  相似文献   

15.
数字图书馆中的视频信息检索   总被引:3,自引:0,他引:3  
视频信息的检索不同于纯文本信息的检索。文章从分类和主题角度出发,介绍了一些检索理论和方法,并提供了一种运用齐夫定律,抽取视频检索提问式中的有效词并编制主题词表的方法。其目的在于提高数字图书馆中视频信息的检索效率。  相似文献   

16.
This paper describes the construction of a synonym thesaurus or entry vocabulary for the SUNY Biomedical Communication Network, which will permit the user greater ease of access to the MeSH-indexed material without previously consulting a printed list of indexing terms. In order to discover the actual terminology used by a researcher, words were extracted from titles of articles appearing in Index Medicus, and compared with the subject heading under which they appeared. As well as strict synonyms, grammatical variants were also included. Work is continuing on relating other indexing vocabularies, such as Excerpta Medica and Current Medical Terminology, used in the biomedical world to MeSH terms.  相似文献   

17.
Present day programs of computerized information retrieval overvalue the importance of retrieving "facts" without either attaching a scale of importance to the material with which they deal or ordering information in any way which corresponds to the order of human thought. The limitations of classification by subject heading become especially apparent when a body of information becomes, through new insight, pertinent to a new area of thought. That body of information thereby acquires new subject headings: thus one sees that the system of retrieval by subject heading can never serve to aid fundamental discovery. The dangers of the present approach lie in their devaluation of traditional methods. Critical reviews are devalued, personal knowledge of the literature is devalued, and a false impression is created that knowledge is the same thing as retrievable information. This diminishes respect for that sort of personal organization of knowledge which alone can serve creative insight.  相似文献   

18.
雷晓  常春  刘伟 《图书情报工作》2019,63(20):121-128
[目的/意义]为增强叙词表实用性,需要不断地将领域中出现的新术语更新到叙词表中,更新维护过程中,从时间及词频等角度对新术语分布特征进行探索研究,可以为新术语发现方法提供参考。[方法/过程]基于新术语相关特征,结合对应文档频率在时间点和时间段上的发展分布,通过相关统计分析,研究术语在不同成长时期的分布特征,尤其界定术语在开始期与成长期的分布差异。[结果/结论]实证分析表明新术语一般处于术语发展的成长期,当候选新术语保持正向增长趋势超过一定年限,可以认为该术语同时具有新颖性、时间持续性及术语性特征。基于该分布特征进行领域新术语的识别,结合词表编制专家的判断,该方法在新术语收录判断中具有较高的准确率,且能有效识别实际应用中占比较多的低频词。  相似文献   

19.
文章选取正在应用的四个图情学主题词表作为研究对象,通过编程方法实现其分类体系的显性化,以此为基础建立一个基于内容、纵向结构和横向关联的三维评价模型,采用统计比较的方法对词表的分类体系进行评价。  相似文献   

20.
机读数据中主题标引若干歧义问题探讨   总被引:2,自引:0,他引:2  
在套入CNMARC格式提供的主题分析字段时,中国国家机读目录数据对下列问题的处理值得商榷:主题分析块主题标引模式,专有名称作主标题的标引方式,对年鉴的“时间因素(D)”的理解,个人文集、选集、全集的主题标引  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号