首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
赵衍  张永娟  陈成材  陈恒 《情报杂志》2012,31(5):185-191
准确性问题一直是困扰计算机自动赋词标引工作的一大难点,很多学者从不同的角度提出了多种提高信息标引准确性的方法。通过比较研究,设计了一种信息标引"前-中-后"综合联动的控制方法来提高计算机自动赋词标引的准确性。该方法由标引前预处理、标引同期控制和后期反馈控制三阶段组成。系统地论述了该方法的原理、特点和实现方式,并在创新型CBA(中国生命科学文摘)数据库中进行实证研究,验证了此方法在提高计算机自动赋词标引准确度方面的有效性。  相似文献   

2.
关键词的择词原则与标引方法研究   总被引:4,自引:1,他引:4  
吴小穗 《现代情报》1999,(6):26-27,13
本文结合"会议论文篇名数据库"采用关键词标引的实例,对关键词标引的选词原则、切分词原则、标引规则与标引方法进行了探讨.  相似文献   

3.
谈谈文献主题标引中常见的问题及其对策   总被引:1,自引:0,他引:1  
文章首先分析了图书馆在文献主题标引工作中存在的问题.认为滥用CIP数据标引,不规范选取自由词进行标引,以自取词进行标引,不使用文内关键词标引,以及错误的主题分析等标引现象是标引工作出现误差的主要原因.文章随后给出了解决这些问题的办法.  相似文献   

4.
本文介绍了在专利文献深度加工中,随着专利文献实现全文检索,为了提高专利文献的查全率与查准率,标引自由词成为了专利文献标引工作的发展方向。本文举例说明了标引自由词的标引方法,通过对中心词的同义词、缩略语、中文词、上位词综合考虑,并根据专利文献的发明点与创新点归纳总结,同时对自由词规范化处理,最终标引出最能体现专利文献信息的标引自由词。  相似文献   

5.
文章介绍自动标引技术的发展现状,并将自动标引技术应用于政府信息公开的标引工作中,针对政府信息公开工作中存在的问题和不足,运用统计加权算法,将词频统计、位置加权、词共现统计三者相结合,设计实现了基于关键词的政府信息公开的自动标引。  相似文献   

6.
句法分析标引方法研究   总被引:5,自引:1,他引:4  
1句法分析标引法原理 句法分析标引是指通过分析句子中每个词的语法作用和词之间的语法关系来选择具有标引意义的词或短语.句法分析标引法一般要借助于一定的解析规则或语法词典,需要较多的人工干预.一般来讲,句法分析包括浅层句法分析和深层句法分析两种.浅层句法分析只限于把句子解析成较小的单元,而不揭示这些单元之间的句法关系;深层句法分析则着眼于充分分析整个句子的语法特点,从而最大限度地揭示句子所反映的主题内容.下面3种标引方法都以深层句法分析为基础.  相似文献   

7.
陈立华 《现代情报》2004,24(6):142-143
本文详细阐述了文献检索系统中自动标引技术的抽词词典、抽词算法及歧义切分等问题。  相似文献   

8.
针对目前科技论文中关键词标引存在的通用词过多、词性不当、主题词漏选、关键词排列顺序不当、标引深度不合适等一系列问题,提出了关键词正确标引的方法.  相似文献   

9.
学术论文关键词的概念及标引方法辨析   总被引:2,自引:0,他引:2  
回顾了学术论文关键词标引的研究成果,指出了存在的问题:关键词概念模糊,标引方法不一致。依据我国相关标准,对学术论文关键词的概念及其标引方法进行了辨析,认为,关键词既不完全是人工语言,也不完全是自然语言,它是从报告、论文中抽取,并经过规范化处理,能反映全文主题内容的单词或术语,学术论文关键词标引步骤应为:文献审读、文献主题分析并抽词、规范化处理、标引结果审校等。并探讨了关键词与标题词、自由词及主题词的关系,以及关键词标引与主题词标引的区别,以加深对关键词概念及其标引方法的理解。  相似文献   

10.
中文期刊文献关键词标引的分析和改进   总被引:8,自引:0,他引:8  
董丽  侯汉清 《情报科学》2004,22(11):1355-1358
期刊文献关键词标引,对于揭示文献主题和文献信息检索有着重要作用。本文以《中国期刊网》上的《中国期刊全文数据库》中的文献为例,与《全国报刊索引数据库》进行标引质量的比较,从标引词来源、标引深度、先组度、标引一致性、通用词使用情况等方面做了抽样统计分析,并对期刊关键词标引提出了改进意见。  相似文献   

11.
通过信息资源的多维度标引实现信息内容表示的标准化,解决现有互联网基于URL带来的信息共享模式困境。本文结合已有的自动标引算法,对其中的关键技术抽词算法和加权算法提出了一些改进,并通过实验对其进行验证。  相似文献   

12.
一个基于本体论全文自动标引方案   总被引:5,自引:1,他引:5  
王泰森 《情报科学》2003,21(9):950-952
本文为支持数字图书馆全文检索精度的提高,提出了一个基于本体论全文自动标引方案。该方案利用本体论的方法,强调词与词之间的内在概念联系,着重解决传统的人工标引不能全面概括全文,而且词与词之间缺乏概念性的连接,很难反映文件主题的全面内容及由于多义词、同义词等的原因造成漏检或检索结果返回信息太多,失去检索意义,达不到理想效果的问题。并为数字图书馆在进行主题标引时实现自动化操作。  相似文献   

13.
因特网经济学未登录词计算机辅助挖掘试验   总被引:2,自引:0,他引:2  
近年来随着社会经济科技和因特网的迅速发展,文献中不断涌现出大量未登录词。未登录词的存在严重影响了汉语自动分词与自动标引的准确率和速率。本文对1000篇经济类网页的关键部位———题名、摘要、关键词、首段进行未登录词挖掘试验,侧重对未登录词挖掘步骤设计和处理方法的讨论。  相似文献   

14.
孟旭阳  白海燕  梁冰  王莉 《情报杂志》2021,(3):125-131,7
[目的/意义]资源数字化时代文献服务向知识服务方向转变,高质量的文献自动标引是文献知识服务能力提升的基础和关键,针对目前英文科技文献自动标引准确率不高的问题,提出了基于语义感知的概念遴选优化方法。[方法/过程]基于知识组织系统的自动主题标引,采用自然语言处理中的神经网络词向量技术,对概念和英文文献内容语义进行表示并进行语义感知与评估,实现概念标引结果在语义层面的遴选。该方法采用基于知识组织系统与自然语言处理技术相结合的方法,弥补了在语义层面上的不足,从而进一步降低不相关概念的影响,提高概念标引结果的准确率。[结果/结论]实验结果表明,该方法具有较好的语义感知性能,在概念遴选上有效降低了不相关概念,大大提高了标引结果的文献相关性,为科技文献资源知识化服务建设和相关研究提供有价值的参考和支持。  相似文献   

15.
全文检索系统新模式的探讨   总被引:7,自引:0,他引:7  
王莉  邓玲怡 《情报杂志》1999,18(1):36-38
针对全文检索的现状,提出一种新的模式:将单汉字无标引全文检索系统和全文后控检索系统的优点结合起来,既绕开了词切分问题,又有效地提高了系统的查全率,并用实例加以说明。  相似文献   

16.
唐晓波  翟夏普 《情报科学》2019,37(4):97-102
【目的/意义】如何识别文本中的知识片段进行标引,使检索系统能检索文本知识内容是提高用户信息利 用效率的关键。【方法/过程】在文献调查的基础上,文章基于本体概念模型和Word2Vec词向量模型阐述了文本片 段语义标引的流程框架,并对本体语义扩展、神经网络模型训练、文本片段标引、文本片段权重获取四个部分的关 键环节及技术做了详细说明。最后通过实验验证了该流程框架。【结果/结论】实验结果显示该方法在文本知识片 段识别上是有效的,知识识别的准确率达到80%,能够实现对文本知识内容进行标引。该方法为自动化实现基于知 识的文本信息组织提供了有益的参考。  相似文献   

17.
文章依据CALLS联合目录提出的文献标引宗旨和方式,针对中文文献书目数据主题标引中的选词、增词、组配以及主标题的确定、单主题和多主题文献的标引进行了探讨,并结合实例加以分析.  相似文献   

18.
邢宝山  李欣欣  王丽 《现代情报》2006,26(12):125-126
本文从副主题词的定义及基本特征入手,分析副主题词在医学期刊文献主题词标引中的作用,即修饰限制作用及通过与主题词组配扩大词量的作用;指出目前副主题词使用过程中存在的问题,如组配错误,组配不恰当,不能正确揭示概念等,并提出提高副主题词标引质量的方法及对策。  相似文献   

19.
网络信息检索系统中信息自动标引方法的设计与实现   总被引:1,自引:0,他引:1  
周晓红 《情报杂志》2005,24(12):41-43
比较了目前主要使用的标引方法,根据网络信息的特点,提出了关键词标引和全文标引相结合的混合标引方法,并给出了具体实现方法,描绘了自动标引的流程图。最后给出了信息标引处理后数据检索方法。  相似文献   

20.
文章依据CALLS联合目录提出的文献标引宗旨和方式,针对中文文献书目数据主题标引中的选词、增词、组配以及主标题的确定、单主题和多主题文献的标引进行了探讨,并结合实例加以分析。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号