首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
主题词又称叙词 ,它是经过规范化处理的词汇 ,在标引中用以表达文件或案卷的主题概念。档案主题标引 ,就是通过文件或案卷内容进行主题分析 ,从主题词表中选择相应主题词标识档案文献并存贮在检索工具中。一、档案主题标引的步骤和方法1 审读档案文件及案卷内容 ,确定主题。通过审读档案文件内容 ,了解其记述的中心和对象是什么 ,分析构成文献的基本概念 ,归纳出主题关系。主题分析应注意两点 :一是档案文献记录和阐述了哪些事物(时间、对象) ,主要特点及相互关系 ,主题属哪种类型 ,由哪些要素组成(观点、特点、方法、凭证、数据、过程…  相似文献   

2.
1 分类检索途径的必要性 1.1 分类检索与主题检索 在文献检索过程中,根据文献的内容特征进行检索的途径主要有分类途径和主题途径.分类途径是从文献内容的学科类别角度进行检索;主题途径是从表达文献内容的主题词入手进行检索.  相似文献   

3.
一、标引的定义目前,国内外图书情报界对“标引”一词还没有一个一致公认的科学定义。但都认为标引是指文献处理工作中的一个过程,即:标引是指对文献资料进行分析、找出主题并参照主题词表或分类表等标引工具,选出代表该主题的主题词或分类号的过程。笔者认为.这一过程应包括下列五个步骤及内容:  相似文献   

4.
在海量信息的背景下,用户画像是实现对用户精准推荐服务的有效工具。科技信息用户画像的关键环节是根据用户关注的文献信息进行主题词抽取。文献主题词抽取的质量直接影响用户画像以及基于用户画像的内容推荐的精准度。鉴于目前常用的文献主题词抽取方法存在高维特征表征稀疏、泛化能力差、易用性受限等问题,提出基于文本共现词分析与TextRank算法的主题特征抽取方法。用该方法对农业科技信息平台用户关注和浏览的文献数据进行主题抽取,将获得的核心特征词作为用户画像的标注主题词,并据此构建用户主题推荐表达式进行文献推荐效果验证。结果显示,采用该方法的文献推荐准确率为93.3%,显著优于高频词法(70.4%)、共现词分析法(74.1%)和TextRank算法(77.8%),表明改进的文献主题词抽取方法在农业信息用户画像及信息推荐服务中具有很好的应用前景。  相似文献   

5.
针对专题文献馆藏--包括纸质、图片、音像、档案手稿、电子数据和实物文物等载体形式的中国共产党处理民族问题的珍贵文献,指出要从内容上把握其意义,将我党民族问题文献按照分析文献内容→确定主题,形成概念→选择主题词加以标识→转换成特定索引语言的步骤,创建一套检索系统,便于读者从主题词直接查找到相关文献。同时,也便于机读和电子查询。  相似文献   

6.
浅谈《中文科技期刊论文数据库》检索技巧   总被引:1,自引:0,他引:1  
《中文科技期刊论文数据库》(以下简称《科技库》),是国内自行研制的系统检索中文科技文献的一个重要的光盘版的检索工具,检索途径有:主题词、分类号、著者、刊名、篇名、复合式6种。在检索文献中,如果用户提出的检索词是一些反映文献主题内容的自由词,通常我们都通过主题词──这个检索途径为读者检索。笔者最近发现,在使用《科技库》检索中文科技文献中,有时篇名检索比主题词检索所得到的文献更令读者感到满意,或者说,篇名检索的查准率高于主题词检索的查准率。 有这样一个例子,本校材料系一用户要求检索一课题:内燃机缸体…  相似文献   

7.
为了适应科学技术的发展,许多图书馆、资料室都开展了主题标引工作,建立了主题检索系统。要想充分发挥检索系统的功能,提高检索效率,必须把住标引质量关,而正确选用主题词是提高主题标引质量的重要环节。如何正确地选取主题词?首先要对文献的主题进行分析。文献的主题分析,就是对文献的主题要素和隐含概念进行综合分析,以便确定主题的中心概念和从属概念,为正确地选取主题词奠定基础。主题分析是在阅读文献的题名、摘要、序言乃至浏览全文的  相似文献   

8.
[目的/意义] 由于传统科技创新主题概率识别方法忽略文本内容语义理解,为了更加准确地识别出主题,科技创新主题语义识别势在必行。[方法/过程] 提出一种基于LDA的科技创新主题语义识别方法,利用语义角色标注技术对科技文献中的科技创新内容进行语义标引,构建LDA主题语义识别模型,根据表征科技创新内容的关键词语义角色对应的上位词的概率识别出科技创新主题。[结果/结论] 通过以3D打印领域数据为对象进行实验,证明该方法能够更加准确地识别出科技创新主题,形成科技创新主题-主题词-科技文献的混合分布聚类集群,减少研究背景等无关数据干扰,避免语义含义相同的科技创新主题词重复统计问题。  相似文献   

9.
由于医学文献的主要主题词和次要主题词在文献中所反映出的重要程度不同,因此在预处理过程中首将主要主题词和次要主题词进行加权处理.在主题速选阶段采用改进信息熵算法对主题进行遴选,最后利用词分析中的战略坐标分析对热点主题进行描绘.  相似文献   

10.
文献的分类标引和主题标引都是对文献主题内容的揭示。这两种标引采用的方法不同,因而它们各有自己独特的功能。分类标引是从学科体系的角度揭示文献主题内容的;主题标引则是从字顺体系的角度,即表达主题概念的语词的字顺序列的角度揭示文献主题内容的。分类标引的特点是学科性和系统性;主题标引的特点是直观性。这两种不同的标引方法对于文献主题内容的揭示深度也是不同的。这种标引深度上的差异主要反映在计算机的标引与检索上。一篇文献输入计算机资料档的主题词标识可以是几个、几十个、甚至上百个;而输入计算机资料档的分类号标识,加上补充标引的分类号标识,最多也不过三个左右,提供的  相似文献   

11.
高校文献课教学实践与思考王惠英,王坚敏,黄惠山(福建医学院)当前,关于高校文献课教学改革的研讨正在深入,我们根据教学实践,谈几点想法。1主题词法应列为精讲的基本知识。对分类法来说,主题词法的主题语言是一种新型的规范化的检索语言。“主题词法(即主题词表...  相似文献   

12.
用主题词和关键词双重标引文献主题初探   总被引:4,自引:0,他引:4  
提出通过用主题词和关键词双重标引文献主题,并建立关键词与主题词间参照关系的设想,使数据库中文献按主题词规范管理,用户以自然语言检索  相似文献   

13.
基于以往对文献保证原则的研究成果及其提出者休姆的论述原文和相关研究文献,阐述文献保证原则的产生背景,提炼文献保证原则的主要内涵———文献而非概念本身是类分的依据、文献著者是分类者而编目员是记录者、图书属性的排序在本质上并无差别,并梳理文献保证原则的演变及其影响。美国国会图书馆分类体系遵照文献保证原则识别新主题词、进行类目修订,具体体现在类型复分、主题复分、主题不同方面的区分、主题关系变化等方面,但该原则存在“ 文化资本占有者的话语渗透”“已类分文献无法随认识而联动”等弊端。我国的文献分类组织应将文献保证原则与科学分类相结合,建设叙词库,注重对主题词词间关系的揭示,确立主题词识别规则。表1。参考文献32。  相似文献   

14.
在向文献数据库发送检索提问后,用户检索到的往往是数量众多且线性排列的文献记录,如何进一步分类这些文献记录以方便用户使用是信息检索领域的重要课题之一。本文以一个比较狭小的主题(脊髓损伤)为文献查询提问,探索利用原数据库中提供的论文主题相似性信息对检索到的文献记录进行聚类的方法,并对每个类别赋予类别标签。本文①利用生物医学权威文献数据库Medline,分别检索PubMed中有关脊髓损伤的部分文献(源文献),实际操作中我们抽取近两年发表的有关脊髓损伤的1906篇文献中前50篇;②利用PubMed中的相关文献功能分别检索出源文献的相关文献(共5108篇),筛选出频次较高的相关文献(出现频次大于或等于5次,共31篇);③形成源文献和相关文献的关联矩阵,根据该矩阵对来源文献进行聚类分析;④分别采用人工分析和主题词的向量空间模型算法提取各类的文献内容或类标签,初步评价分类结果的正确性。经过基于相似性的聚类分析,可以将脊髓损伤的源文献分为3个大类,对比人工分析和主题词向量空间模型方法对来源文献的内容提取,二者基本相符。就本文研究涉及的主题而言,利用文献数据库中提供的论文相关性信息对检索结果进行再次分类的方法是可行的。  相似文献   

15.
当前文本主题获取方法大多依靠单一关联分析,不能全面分析可获取信息,难以准确获取科技发展主题。科技文献的主题词、作者和引文之间蕴含了以研究主题内容为纽带的语义关联关系,主题词共现关系、引文关系和合著关系分别从不同的角度展现了主题关联关系。因此,本文根据主题词之间语义关系距离的远近,将主题识别中主题词关联分为基础关系、强化关系和新增关系,在此基础上提出面向主题识别的多元关系抽取及关系融合方法;并以基因工程疫苗的研发与制备领域为例进行领域实证分析,利用PathSelClus算法实现基于多元关系融合的主题聚类,通过对比实验证明多元关系融合可以有效提高实证领域的文本主题聚类效果,而未来多关系融合主题识别则是需要重点关注的问题。图4。表6。参考文献19。  相似文献   

16.
詹嘉 《江西图书馆学刊》2006,36(3):78-78,128
论述了陶瓷文献标引中常见的主题理解偏差、主题词选择失当等错误,分析了导致错误的主要原因。认为做好陶瓷文献主题标引的关键是抓住主题概念的揭示、文献主题结构分析和先组词的使用这三个环节。  相似文献   

17.
科技期刊主题标引中常见错误分析   总被引:1,自引:0,他引:1  
主题标引,是指通过文献主题分析,给文献以主题词作为检索标识的过程,是文献控制的基本方法之一,也是科技期刊编辑规范化要求。主题标引技术广泛地应用于各种检索系统中,尤其是检索期刊与计算机检索系统。目前世界上一些重要的计算机文献检索系统和检索期刊都采用主题词作为检索标识。我国大部分  相似文献   

18.
王平 《图书情报工作》2014,58(22):70-77
自动挖掘科技文献主题并识别主题变化对于科研工作者及时获取相关领域的最新研究动态有着重要作用.针对科技文献主题多样、动态性强等特点,分析科技文献主题发现及演化具体方法,基于层次概率主题模型hLDA,采用Gibbs抽样来进行模型参数估计,并运用互信息的方法对主题词进行筛选,以提取高质量的主题词.最后,利用先/后离散分析方法研究主题随时间的演化问题.实验结果验证了主题发现及演化方法的可行性及有效性.  相似文献   

19.
刘洋  崔雷 《图书情报工作》2014,58(6):101-104
以引文上下文为研究对象,探讨来自于引文上下文、目标文献摘要以及目标文献自标医学主题词(下称主题词)三者间的符合程度,定量分析引文上下文在表征目标文献内容特征时的作用。以被Circulation杂志高频引证的5篇研究类论文作为目标文献,提取其施引文献的全部引文上下文,并对其进行分词及主题词匹配;将其结果与目标文献摘要提取的主题词以及文献自标的主题词进行两两比较。结果表明,引文上下文与目标文献摘要具有较高的符合度,而且在表征被引文献内容特征的效果上明显具有优势。  相似文献   

20.
著录项目中最具有检索意义的是主题词,而著录工作的难点也在于如何准确提炼档案主题,选好主题词。主题词标引的准确、全面与否,直接影响着档案信息资源的检全率和检准率。在著录工作中,由于种种原因,有的档案工作者为提高工作效率,不仔细阅读档案内容,简单采用“望题标引”、“字面组配”等不恰当的主题词标识方法,导致主题标识不能准确反映档案内容,出现主题词“标引不足”或者“标引过度”,降低著录质量。所谓“标引不足”是指著录标引时选择的主题词不能全面、准确地解释档案内容,造成对档案内容的漏著、误著。如“一份关于XX县外贸出口…  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号