首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
关于文献关键词标引问题   总被引:1,自引:0,他引:1  
对文献关键词标引问题进行了论述.指出了科技文献关键词标引中的一些误区,提出了文献作者和科技期刊编辑人员在标引关键词时的规则和注意事项.同时,还指出了关键词标引对文献存储和检索的重要作用.介绍了关键词和主题词的关系.  相似文献   

2.
档案主题标引实用算法   总被引:2,自引:1,他引:1  
本文介绍了档案文献主题词自动标引算法,该算法合理地构造了主题词切分词典,并将切分关键词和标引主题词的实现过程融为一体,使标引与检索算法变得简单清晰。本文还给出了主题词切分词典的维护算法,以及自动扩缩检算法。利用本算法思路编制的软件已用于实际的档案管理系统中。  相似文献   

3.
关键词标引的若干问题探讨   总被引:15,自引:1,他引:14  
丁春 《编辑学报》2004,16(2):105-106
分析关键词标引中存在的若干问题,探讨关键词与文献主题、标题词、专业术语、主题词、自由词的关系,提出提高关键词标引质量的对策.  相似文献   

4.
现有的主题标引方法一般只能抽取文本中出现的词汇,无法从几万或数十万主题词中选择语义关联强且未出现的词汇;基于机器学习的多标签分类算法则需要每一个标签下有训练数据,限制了它们在主题标引上的应用。面向大规模主题词在海量文献上的标引需求,提出一个基于分布式词向量的混合型自动标引方法,利用大规模语料训练的词向量生成同维度的主题词表示向量和文本表示向量,实现主题词与文本语义相似度的计算。基于大规模语料构建主题词与普通词的映射表,使文本向量只和少量的语义强相关主题词向量比较,大大减少了计算量,提高了标引效率。开发的自动标引工具对近亿篇文献进行了主题标引,达到了较高的速度。与结巴关键词的实验对比结果显示,本文方法抽取的主题词与作者关键词重合度较低,且在去除结巴关键词中的非主题词后,取得了比结巴关键词更高的标引准确率;与人工标引的实验对比结果显示,随着人工标引词数量的增加,本文方法的效果、结果与人工标引结果的一致性在不断增加。  相似文献   

5.
[目的 /意义]提出一种基于融合显隐式信息的单类协同过滤算法的文献主题词推荐方法,以提高面向学者和文献的主题词推荐的准确率。[方法 /过程]通过构造一种基于文献丰富度和主题词流行度的矩阵分解模型,测度出文献和未出现在当前文献中的主题词相关性概率,并根据相关性概率的大小将这些主题词划分为文献的隐式相关主题词和隐式无关主题词。然后针对这两种主题词,分别提出两种不同的主题词权值预测方法,即融合偏好系数的自编码器填充模型和零值填充模型。[结果 /结论 ]在面向人工智能领域的科技文献数据集SD4AI上的实验表明,较各种其他典型协同过滤方法,本文方法可分别提高预测主题词权值和识别高权值主题词的推荐效果,MAE和FCP的提升幅度最高达16.07%和16.83%,P@N和NDCG@N的推荐效果最高达22.37%和27.06%。  相似文献   

6.
提倡“一体化”河北轻化工学院学报编辑部陈玉堂,王士敏,李穆“一体化”是指编辑出版部门在编辑加工一次文献的同时,肩负起情报加工的前期任务即对文献的主题词或关键词、分类号进行标引,对摘要进行提炼、加工。“一体化”是中国高等学校学报论文文摘(英文磁带版)─...  相似文献   

7.
马费成  陈锐 《情报学报》1999,18(4):376-383
本文系国家自然科学基金项目:“科学信息离散分布的机理与模型研究”的第四部分。文章以布拉德福定律为参照系,以主题词或关键词表证知识单元考察了科学信息的离散分布特征,即分别以载文量、主题词或关键词总数和核心词数为分区标准,研究科学信息在不同分区标准下的分布特征。结果发现,科学信息从文献单元到内容单元其离散程度越来越高。  相似文献   

8.
本世纪70年代末,随着计算机的昔及与联网,国际国内先后发布了一系列与学术论文撰稿和期刊工作有关的标准和法规。其中,主题词的标引就是一项重要的内容。这是因为,论文是科学研究中创造性思想的载体,它的首要任务在于传递科研信息,同时也具有文化储存和文化积累的意义。无论是从传递角度,还是储存角度考虑,主题词或关键词的标引都将给我们文献的储存和检索带来极大的方便。  相似文献   

9.
某些文献资料,乍看起来其内容是多主题词的,其实很多情况是关键词,关键词与主题词易于混淆。组成文献资料名称的关键词,对于特定文献资料的检索能起一定的作用,但与编制主题目录的实质不相符。主题目录只选择能反映文献资料内容的主题词作标题,而要排除关键词作主题词用,这样,主题目录就会缩小庞杂现象,增强其集中同主题文献资料的效能。因此,编制主题目录时,主题词与关键词两个概念必须搞清楚。  相似文献   

10.
针对秘书学界将取消公文主题词的原因解读为"公文主题词标引的随意性大,且标引方法繁琐";"可以减少公文的制作成本,减轻公文制作者的负担";"主题词失去它的检索功能";"未产生较好效果"等认识,本文认为,取消公文主题词的真正原因是由于在现有的技术条件下,关键词检索比主题词检索更方便、快捷,关键词完全可以取代主题词,这是取消公文主题词的真正原因。  相似文献   

11.
将自然语言应用到信息组织、标引、检索和分析所需的各种词表中,实现自然语言与受控语言间的互操作,是新一代知识组织系统构建模式。文章围绕“关键词识别与扩充、关键词-主题词映射关系构建、关键词-主题词映射关系更新”3个方面,介绍了中文生物医学关键词-主题词映射表的计算机辅助构建与维护机制,以及系统的功能架构。  相似文献   

12.
本文系国家自然科学基金项目:"科学信息离散分布的机理与模型研究"的第一部分(总体研究框架).文章以布拉德福文献分散定律为参照系,选择文献中的关键词或主题词作为计量单元,从大型数据库中输出数据,在微观层次上研究科学信息离散分布的规律.  相似文献   

13.
本文系国家自然科学基金项目:“科学信息离散分布的机理与模型研究”的第一部分(总体研究框架)。文章以布拉德福文献分散定律为参照系,选择文献中的关键词或主题词作为计量单元,从大型数据库中输出数据,在微观层次上研究科学信息离散分布的规律。  相似文献   

14.
基于Web of Science的本体研究论文定量分析   总被引:3,自引:0,他引:3  
以Web of Science为情报源,以主题词为检索方式,采用定量分析的方法,从论文的年代分布、期刊分布、作者、关键词以及被引频次等几个方面进行统计分析,确定本体研究领域的核心期刊、核心机构、核心作者和经典文献, 同时对本体的研究主题也进行了基于定量的分析。  相似文献   

15.
试论信息检索途径的多样性   总被引:7,自引:0,他引:7  
有感于平时上信息检索课找不到一泰关于信息检索途径方面的完整资料,于是自己动手归纳。文章在简要介绍信息检索概念和检索原理的基础上,从文献的形式特征和内容特征两个方面提出了多种信息检索途径,如题名途径、著者途径、序号途径、引文途径、“名称”途径、来源途径、关联途径、年代途径、分类号途径、摘要途径、代码途径、主题词途径,主题词途径包括标题词途径、元词途径、叙词途径、关键词途径等等。  相似文献   

16.
目前,越来越多的辩技期刊对论文标引主题词或关键词,主题词取自于词表,是经过规范化处理的词,表达同一主题的词在任何情况下都具有完全一致的字面形式。关键词是自然语言,直接从文章中抽取,同一主题慨念的词可呈现多种字面形式。显然,只有主题词才具有真正的检索意义。国家有关部门规定关键词应尽量从主题词表中选用。因此,论文标引应以主题词为基准。  相似文献   

17.
本文以"非典型肺炎"和"甲型H1N1流感"两个传染病作为研究样本,以中国知网(CNKI)数据库中的文献关键词作为语料库来源,基于用户关键词词频统计,并结合人工核查,分析同一概念的同义词和近义词以确立关键词词间的等同关系。目的是了解用户关键词和MeSH主题词之间的差异,分析用户表达偏好和习惯,进而为叙词表维护中的候选词汇选择提供一定的参考。  相似文献   

18.
图书馆检索系统利用关键词检索的必要性   总被引:1,自引:0,他引:1  
本针对网络环境下读检索的实际需求,探讨了增加关键词检索的必要性,并且对规范主题词检索与关键词检索的利与弊进行了分析,同时提出了作的个人见解。  相似文献   

19.
本文系国家自然科学基金项目:“科学信息离散分布的机理与模型研究”的第五部分( 知识单元离散分布的图形模拟) 。文章以主题词或关键词表征知识单元,运用Logistic 函数模拟关键词或主题词的分布图像,包括词总数、个数和核心词,得到关键词或主题词总数、个数和核心词的离散分布方程,并用K—S检验对模型进行了检验  相似文献   

20.
本文系国家自然科学基金项目:"科学信息离散分布的机理与模型研究,,的第五部分(知识单元离散分布的图形模拟).文章以主题词或关键词表征知识单元,运用L昭istic函数模拟关键词或主题词的分布图像,包括词总数、个数和核心词,得到关键词或主题词总数、个数和核心词的离散分布方程,并用K-S检验对模型进行了检验.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号