首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 141 毫秒
1.
用主题词和关键词双重标引文献主题初探   总被引:4,自引:0,他引:4  
提出通过用主题词和关键词双重标引文献主题,并建立关键词与主题词间参照关系的设想,使数据库中文献按主题词规范管理,用户以自然语言检索  相似文献   

2.
正确标引主题词的意义与规则●宋双明刘阳娥【重庆目前,越来越多的科技期刊对论文标引主题词或关键词。主题词取自于词表,是经过规范化处理的词,表达同一主题的词在任何情况下都具有完全一致的字面形式。关键词是自然语言,直接从文章中抽取,同一主题概念的词可呈现多...  相似文献   

3.
目前,越来越多的辩技期刊对论文标引主题词或关键词,主题词取自于词表,是经过规范化处理的词,表达同一主题的词在任何情况下都具有完全一致的字面形式。关键词是自然语言,直接从文章中抽取,同一主题慨念的词可呈现多种字面形式。显然,只有主题词才具有真正的检索意义。国家有关部门规定关键词应尽量从主题词表中选用。因此,论文标引应以主题词为基准。  相似文献   

4.
WordNet与SUMO本体之间的映射机制研究   总被引:1,自引:0,他引:1  
针对本体概念与自然语言词汇之间存在普遍性与特殊性的矛盾,以WordNet同义词典和SUMO本体为研究对象,对两者进行简要概述,详细分析两者之间的映射动机,提出自然语言词汇、WordNet同义集和SUMO本体概念之间的映射模型,并深入分析WordNet同义集与SUMO本体概念之间的映射实例、映射效果及应用。希望藉此更好地利用WordNet同义词典与SUMO本体概念之间的映射关系去解决本体概念与自然语言词汇之间的矛盾,促进本体更广泛地应用于智能检索、语义分类、数据挖掘等领域。  相似文献   

5.
现有的主题标引方法一般只能抽取文本中出现的词汇,无法从几万或数十万主题词中选择语义关联强且未出现的词汇;基于机器学习的多标签分类算法则需要每一个标签下有训练数据,限制了它们在主题标引上的应用。面向大规模主题词在海量文献上的标引需求,提出一个基于分布式词向量的混合型自动标引方法,利用大规模语料训练的词向量生成同维度的主题词表示向量和文本表示向量,实现主题词与文本语义相似度的计算。基于大规模语料构建主题词与普通词的映射表,使文本向量只和少量的语义强相关主题词向量比较,大大减少了计算量,提高了标引效率。开发的自动标引工具对近亿篇文献进行了主题标引,达到了较高的速度。与结巴关键词的实验对比结果显示,本文方法抽取的主题词与作者关键词重合度较低,且在去除结巴关键词中的非主题词后,取得了比结巴关键词更高的标引准确率;与人工标引的实验对比结果显示,随着人工标引词数量的增加,本文方法的效果、结果与人工标引结果的一致性在不断增加。  相似文献   

6.
用于中文信息自动分类的《中图法》知识库的构建   总被引:1,自引:0,他引:1  
分类号、主题词、关键词是三种主题概念标识,三者之间存在着概念对应关系,即兼容关系。中文文献数据库中存在着大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些数据的加工整理,以《中图法》类目体系为主干组织各学科领域的语词,从而构建出反映分类号与语词概念对应关系的《中图法》知识库,用以实现信息的自动标引和自动分类。本文详细讨论了该知识库的构建原理、结构、编制使用的关键技术以及主要应用等。  相似文献   

7.
分析MeSH在PubMed、中国生物医学文献数据库、中国医院知识资源总库和万方医学网中的应用,总结出MeSH在医学信息检索中的三种应用机制,即直接使用主题词检索、实现自然语言或分类号向主题词的转换以及利用主题词等级范畴表进行知识导航,进而提出加强中文主题词表和中文一体化医学语言系统的构建与研究的建议。  相似文献   

8.
尽管自然语言的关键词标引和规范语言的主题词标引都被用于揭示和查询同一主题的档案,但它们实现的方式却不相同。所以没有严格的限制条件而随意判定哪一个更好,是不现实的。谁个优,谁个劣完全取决于系统需求的平衡。对这个“平衡”议论较多的一种说法是“背着抱着一样沉”。持这种观点的人认为:自然语言关键词是标引速度快、输入端工作量小,成本低,但检……  相似文献   

9.
关键词标引的若干问题探讨   总被引:15,自引:1,他引:14  
丁春 《编辑学报》2004,16(2):105-106
分析关键词标引中存在的若干问题,探讨关键词与文献主题、标题词、专业术语、主题词、自由词的关系,提出提高关键词标引质量的对策.  相似文献   

10.
〔摘要〕 对CSSCI来源文献标引主题词进行多维聚类分析:首先选择22个学科及其来源关键词数据,通过建立相似性矩阵分析各学科关系,并采用降维办法在二维平面上显示22个学科的相对位置,然后将各关键词按照其和各学科的关系,通过可视化的主题词分布图绘制中国人文社会科学的科学地图,借助该地图可以可视化地了解当前国内人文社会科学各学科关系,揭示2000-2004年中国人文社会科学发展的基本关系和趋势。  相似文献   

11.
主题法在网络信息组织中的应用   总被引:17,自引:0,他引:17  
主题法包括关键词法,标题词法,叙词法等。主题法作为两种主要的情报检索语言之一,其功用在传统的文献检索中已经得到了充分的体现。本文论述了以上三种语言的特点以及在网络信息组织中的应用方法。  相似文献   

12.
《中国分类主题词表》的SKOS描述自动转换研究   总被引:2,自引:1,他引:1  
SKOS为知识组织系统(叙词表、分类法、主题词表、术语表等)提供了一套语义Web环境下简单灵活、机器可理解的描述和转换机制,使叙词表之间、叙词表与本体之间的共享成为可能.利用Java语言编写内容提取程序,将<中国分类主题词表>电子版中的主题词、词间语义关系、分类号、注释等提取,并分别存储在关系数据库中,然后通过SQL语言从数据库中提取相关字段,用Java语言写入SKOS描述的对应标签中,形成自动转换的SKOS描述代码.但对<中国分类主题词表>的附表部分如何在语义环境中实现SKOS描述及自动转换仍需进一步研究.  相似文献   

13.
本文主要对分类主题一体化词表的理论及研制进行述评,包括分类主题一体化研究的发生与发展、分类主题一体化概念、分类法与主题法结合一体的理论及我国检索语言词表研制的发展进程和发展趋势。  相似文献   

14.
在对SEEKSpace的功能需求进行分析,明确其主要功能和服务需求的基础上,对以DSpace为基础进行SEEKSpace运行和服务平台建设的主要任务和过程进行讨论,内容包括DSpace的本地化、WEB界面的调整和优化、信息组织模型及其映射、元数据编辑模板的定制、永久标识符系统的启用、OAI及SRW开放接口的开放等。  相似文献   

15.
叙词表在网络信息组织中应用的调查分析及其优化   总被引:1,自引:0,他引:1  
司莉 《图书馆论坛》2007,27(6):183-186,105
通过对英文叙词表在网络信息组织中的全面调查与分析,揭示其应用的类型、检索途径及学科范围与语种等特点,从词表的显示与操作、使用帮助、互操作、向多语种发展以及叙词表管理系统等方面提出优化对策。  相似文献   

16.
香港和北京地区中文名称规范数据之比较   总被引:4,自引:0,他引:4  
文章从规范范围、标目选取原则、各种标目形式和著录语言几个方面,对香港和北京地区的中文名称规范数据进行了比较分析,并对规范工作的未来发展提出了设想和建议。  相似文献   

17.
Spanish is one of the most widely spoken languages in the world and the various subject heading lists in the language reflect its geographic diversity. Catalogers assigning Spanish subject headings typically must rely on a variety of different sources in different formats. The lcsh-es.org database unites several of these sources in a single search interface to simplify the work of Spanish language subject catalogers and encourage collaboration. A look at current developments suggests that high-level international agreement on linked data technology and policy bode well for the future of multilingual subject authorities.  相似文献   

18.
博客(Blog)资源的信息组织   总被引:1,自引:0,他引:1  
本文分析了中文博客信息资源在信息组织方面的特殊性,侧重讨论了文章时序组织、形式分类法、形式主题法以及关键词聚类组织。同时分析了博客资源的侧重人文因素的信息组织方法,包括博客文章的自我组织、博客网站的公共组织方法以及博客资源网络分类目录。此外,探讨了博客资源侧重技术因素的信息组织方法包括内容聚合RSS、信息推送push以及博客搜索引擎。  相似文献   

19.
基于词典约简及多分类算法的文本分类系统的设计与开发   总被引:3,自引:1,他引:2  
文本自动分类是目前机器学习、自然语言处理和信息资源检索领域的研究热点之一.本文在对自动分类的实现技术问题进行探讨的基础上,尝试对自动分类的几个环节提出改进措施.具体包括:采用约简法进行抽词词典的构造,采用投票法进行文本特征的选择,采用层次法进行逐层次的分类,采用统计与规则相结合的方法进行分类器的构造等.通过在不同语料库上与传统分类方法的对比测试表明,上述改进措施能够有效提高自动分类的性能,基于这些改进措施所开发的自动分类系统具有大规模文本自动分类的可行性.本文详细讨论了相关改进措施的原理、实现算法、流程及存在的问题.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号