首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
本文从档案主题词标引实践出发,论述了主题词表本身影响主题词标引一致性的问题,强调统一词表及规范标引的重要性。  相似文献   

2.
文书类档案的主题标引研究   总被引:4,自引:0,他引:4  
本文介绍一种基于全文的主题词自动标引方法。该方法将切分关键词和标引主题词融为一体,合理地构造了词典。本文还给出一个确定标引主题词的加权函数,讨论了一些相关的技术问题  相似文献   

3.
本文对公文与档案著录标引主题词和主题词标引在公文与档案检索中的重要作用作了阐述,对目前在主题词标引中存在的问题以及对检索产生的影响作了分析,提出了一些对策和值得思考的问题。  相似文献   

4.
课程主题词是一类特殊的主题词,使用范围应受到严格限制.课程主题词只能标引中等教育程度以下、类分到<中国图书馆分类法>"G4教育类"的主题,中等专业教育程度以上的各科教材与教学参考书应使用反映其主题的学科主题词标引,分类标引各人其类.  相似文献   

5.
档案主题标引具有规范性强、组配性好、专指性准等优点,同时对标引质量也要求较高。只有标引的每个主题词都是正式主题词,都是和主题概念相对应的、并能准确反映档案主题概念的主题词,才能最大限度地实现档案检索时的查全率和查准率。然而,在具体实践中,往往容易产生误差,影响标引质量。 一、标引度掌握不准 国家行业标准《档案主题标引规则》中将档案主题标引深度规定为“赋予一个标引对象主题词数量的多少。”在实际工作中,由于各人理解和判断的角度不同,对同一份档案标引的主题词数量有多有少,我们通常称之为标引过深和标引过浅。 1、标…  相似文献   

6.
档案主题词标引之我见   总被引:1,自引:0,他引:1  
主题词是在标引和检索中用以表达档案主题内容的规范化的词或词组。自上世纪80年代中期开始档案著录标引工作以来,主题词标引始终是各档案馆档案著录标引工作的瓶颈(因为当时大量的著录标引工作还集中在进馆档案上)。随着公文格式的规范化,主题词在公文形成阶段就已经标引完毕,减轻了档案馆的工作压  相似文献   

7.
CNMARC中的610字段是非控主题词字段,对标引610字段应遵循的非控主题词选词原则、选词方法、词语控制、标引规则以及应注意的问题进行了讨论。  相似文献   

8.
王芳群 《图书馆》1995,(1):50-51
为了保证文献标引的质量,文章根据实践经验,论述了主题标引时应该遵循的一些原则,这即是尽力发挥组配标引的优越性,尽力选用专指性标引揭示文献的内容,还应注意选用正式主题词、用上位概念的主题词及大词标引和增词标引。  相似文献   

9.
档案主题标引实用算法   总被引:2,自引:1,他引:1  
本文介绍了档案文献主题词自动标引算法,该算法合理地构造了主题词切分词典,并将切分关键词和标引主题词的实现过程融为一体,使标引与检索算法变得简单清晰。本文还给出了主题词切分词典的维护算法,以及自动扩缩检算法。利用本算法思路编制的软件已用于实际的档案管理系统中。  相似文献   

10.
主题标引的原理和方法(一)张琪玉(空军政治学院)必须说明,主题标引可分为标题词标引、叙词标引、单元词标引、关键词标引、自由标引等多种,本文仅限于叙词标引。叙词通常称为主题词,故也可称为主题词标引。所谓主题标引,是指用语词标识(即标题词、叙词、单元词、...  相似文献   

11.
现有的主题标引方法一般只能抽取文本中出现的词汇,无法从几万或数十万主题词中选择语义关联强且未出现的词汇;基于机器学习的多标签分类算法则需要每一个标签下有训练数据,限制了它们在主题标引上的应用。面向大规模主题词在海量文献上的标引需求,提出一个基于分布式词向量的混合型自动标引方法,利用大规模语料训练的词向量生成同维度的主题词表示向量和文本表示向量,实现主题词与文本语义相似度的计算。基于大规模语料构建主题词与普通词的映射表,使文本向量只和少量的语义强相关主题词向量比较,大大减少了计算量,提高了标引效率。开发的自动标引工具对近亿篇文献进行了主题标引,达到了较高的速度。与结巴关键词的实验对比结果显示,本文方法抽取的主题词与作者关键词重合度较低,且在去除结巴关键词中的非主题词后,取得了比结巴关键词更高的标引准确率;与人工标引的实验对比结果显示,随着人工标引词数量的增加,本文方法的效果、结果与人工标引结果的一致性在不断增加。  相似文献   

12.
著录项目中最具有检索意义的是主题词,而著录工作的难点也在于如何准确提炼档案主题,选好主题词。主题词标引的准确、全面与否,直接影响着档案信息资源的检全率和检准率。在著录工作中,由于种种原因,有的档案工作者为提高工作效率,不仔细阅读档案内容,简单采用“望题标引”、“字面组配”等不恰当的主题词标识方法,导致主题标识不能准确反映档案内容,出现主题词“标引不足”或者“标引过度”,降低著录质量。所谓“标引不足”是指著录标引时选择的主题词不能全面、准确地解释档案内容,造成对档案内容的漏著、误著。如“一份关于XX县外贸出口…  相似文献   

13.
针对秘书学界将取消公文主题词的原因解读为"公文主题词标引的随意性大,且标引方法繁琐";"可以减少公文的制作成本,减轻公文制作者的负担";"主题词失去它的检索功能";"未产生较好效果"等认识,本文认为,取消公文主题词的真正原因是由于在现有的技术条件下,关键词检索比主题词检索更方便、快捷,关键词完全可以取代主题词,这是取消公文主题词的真正原因。  相似文献   

14.
本文就《中国分类主题词表》(第二版电子版)使用中,关于中小学课程主题词容易产生歧义导致选词偏差的两个问题举例加以探讨,并指出课程主题词中的几处用代关系,并提醒标引人员注意主题词内涵与外延的变化,做到正确选词、正确标引。  相似文献   

15.
指出主题词表和分众分类系统作为两种不同的信息组织系统,在网络资源组织中发挥着各自的作用。以教育领域的主题词及Delicious系统中标签为研究对象,分析主题词在标签系统中的应用状况,发现有57%的主题词被作为标签进行标引,通过统计主题词、标签的频率、字符长度、语言特征等,明确用户标引的特征,依此提出筛选标签作为主题词候选词汇的标准。  相似文献   

16.
国家图书馆中文图书自由词标引规则   总被引:1,自引:1,他引:0  
自由词标引是对以<中国分类主题词表>为依据的主题标引的补充.一篇文献必须先用正式主题词作较泛指的组配标引、上位词标引、靠词标引,再用自由词作较专指的标引,即作双重标引.  相似文献   

17.
通过对CALLS联合目录“中文书目分类—主题整理项目”中的U大类交通运输类的整理,发现CALIS数据库中存在着主题词标引次序混乱、同一主题的标引不一致、总论复分添加不统一、文献类型主题词局限及标引不可重复、增词原则不严谨和名称主题规范不标准,分类主题标引没有一体化等问题,要一一得以妥善解决,必须严格按照分类主题标引的细则、组配标引模式来进行标引,并建立主题规范记录库,以提高书目数据库的标引质量。  相似文献   

18.
标引是文献数据库建设的关键   总被引:3,自引:1,他引:2  
文章论述了文献标引对文献数据库建设的重要性.在说明最优化标引衡量标准的基础上,着重提出了标引人员的素质、标引规则的制定、叙词表的适用性、主题分析、主题词的选用等是实现最优化标引的重要因素;最后,介绍了几种标引方法.  相似文献   

19.
中文全文标引的主题词标引和主题概念标引方法1   总被引:20,自引:3,他引:17  
韩客松  王永成 《情报学报》2001,20(2):212-216
中文全文标引正在越来越受到重视。本文主要研究了三个方面的问题,首先是全文主题词标引的加权问题,综合考虑了五个方面的因素;其次是介绍了一种用层次概念词典改进主题词标引质量的新方法;最后又提出了用三种不同的方法产生主题概念进行全文标引的的主题概念标引。受限范围内的实验结果显示本文的方法有一定的理论和实用价值。  相似文献   

20.
档案主题标引具有规范性强、组配性好、专指性准等优点,同时对标引质量也要求较高.只有标引的每个主题词都是正式主题词,都是和主题概念相对应的、并能准确反映档案主题概念的主题词,才能最大限度地实现档案检索时的查全率和查准率.……  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号