共查询到20条相似文献,搜索用时 93 毫秒
1.
图书标引是图书检索的前提和基础,把图书或摘要标引成概念图的形式,将有利于满足基于自然语言表述的图书检索需求。从科技类文献摘要出发,通过手工标引,总结常用的概念间关系作为概念图标注的关系集合,结合叙词表构造术语部件库,以便辅助术语识别,用MBL方法进行概念关系构建,在此基础上,提出了一个概念图生成算法,并开发了一个概念图半自动标引的实验原型系统。原型系统的实验表明,该种概念图半自动标引方法获得了较高的正确率。 相似文献
2.
研究从科技论文文本中抽取作者关键词以外的科技术语的方法。因为标引效应问题,单纯选择论文中的关键词作为候选术语会影响术语库的数量和质量,需要考虑从论文文本中抽取术语。现有的大多数术语抽取方法重视采用termhood指标,而忽视unithood指标,针对此问题,在C-value算法的基础上,提出用于生成候选术语的中文术语构词规则和测量术语内部结合强度的unithood指标,实现从论文文本中抽取中文科技术语。以信息资源管理领域的术语抽取为例对提出的方法进行验证,实验结果证明,提出的方法能够有效地抽取领域科技术语,抽取精度较高。 相似文献
3.
4.
关键词标引是文献检索中最基础也最重要的环节。地质学论文具有很强的学科特色,本文从读者检索的角度出发,针对地质学研究的时空特点,归纳总结了地质学论文在研究区域和地质时代的关键词标引中存在的问题。地质学是研究地球及其演变的一门自然科学,其研究对象的空间尺度变化大,时间跨度长,因此,表达地质学时空概念的词汇通常是地质学论文关键词检索中优先选择的检索词。一篇优秀的论文应准确选择关键词标引。在地质学论文的区域范围关键词标引中应避免表示的研究区范围过大或过小以及选取的关键词随意性太强,将一些泛义词选作关键词等问题;在地质年代和年代地层的关键词标引中应避免出现二者的混淆使用及使用废弃的地质术语和地质年代范围词组等问题。 相似文献
5.
科技术语属性抽取方法研究* 总被引:3,自引:0,他引:3
使用共现分析的方法从术语定义抽取术语属性,然后使用对应分析的方法对科技术语和术语属性之间的关系进行分析,并使用图形作为表达方式。最后利用市场营销学科领域的科技文献进行实证研究,对市场营销的概念进行深入挖掘,发现市场营销领域学科研究重点和研究内容等有价值的信息。 相似文献
6.
ISO 30300:2011《信息与文献文件管理体系基础与术语》修订版《信息与文献文件管理核心概念与术语》于2020年4月正式发布,首次统一了文件管理领域的核心概念和术语及定义。比较新旧标准的研制动机和研制方法论、内容和结构对文件管理工作具有实践指导意义,比较新旧概念图及其变化对理解文件管理标准化的新思想更具有理论指导意义。通过对新旧标准文本构成及要素的比较,讨论了新标准特点及其对中国文件档案标准建设的启示,揭示出国际标准化领域文件管理标准化工作和术语标准化工作的发展方向。 相似文献
7.
8.
正术语是在特定专业领域中一般概念的词语指称。档案术语是档案领域中一般概念的规范表达方式。定义是对概念的语言描述,是明确概念内涵的逻辑方法。定义指明某一概念在概念体系中的确切位置,并将该概念同相关概念进行区分。定义的表述是编制术语标准中非常重要的环节, 相似文献
9.
本文基于术语共现理论,利用形式概念分析中概念格的自动生成来推理作为属性的领域专业术语的层次结构并进行可视化展示,进而提出了一整套用于实现领域本体概念层次关系构建的解决方案,具体包括文档/词汇与术语语义关联的识别、领域形式化背景的建立、基于形式概念分析的主题概念的生成、基于主题概念格的术语层次关系抽取、术语层次体系的OWL描述和图形展示等.笔者以“白血病”领域为例,详细论证了无知识库支持环境下中文文本到医学学科术语层次结构的衍化过程,并对以文档术语矩阵(DTM)和词汇术语矩阵(WTM)为形式化背景生成的术语层次体系进行了比较分析. 相似文献
10.
统计分析法自动标引的改进 总被引:12,自引:2,他引:10
情报检索的目的是为用户服务,因而标引词的提取应以其与文献主题内容相关程度为标准。文章基于原有的统计分析标引法,对其权值设计予以重新考虑,并与文献词频统计相结合,使分词与标引相统一,标引词更好地反映文献主题概念,提高检索效率。 相似文献
11.
自动标引是现代信息检索研究工作的重点之一,论述了自动标引的整个过程中所应该注意的问题,并描绘了自动标引的流程图。 相似文献
12.
13.
学术论文英文关键词标引存在类似于中文关键词的不能反映主题概念、通用词过多、词序不当等问题,还存在简洁性不强、缩略语过度使用、词形不当、译写不当或错误等问题,导致英文关键词检索质量较低。控制英文关键词标引质量不能仅限于数据库专职标引人员的主题标引,还包括社会或学术团体控制、编辑控制、作者控制等3个方面。 相似文献
14.
15.
赵宗仁 《现代图书情报技术》1993,9(1):12-15
本文主要介绍利用微机通用管理系统ISIS的PASCAL语言开发的并集成于该系统的“汉语科技文献自动标引系统CADAIS”的系统构成,功能,自动标引原理,词典结构与建立方法,标引算法和实验情况等。 相似文献
16.
17.
18.
基于概念空间方法的信息检索技术研究 总被引:14,自引:0,他引:14
为了解决词汇差异问题,词表构造在信息检索系统中有着重要意义。概念空间方法是利用计算机自动构造概念语义网络(词表)并以此为基础进行概念检索的一种方法。由词语作为语义网络的节点,词语之间的关联权重以一个给定文档集合中词语的共现率来计算,其大小代表它们之间的相似性。检索时系统采用人工智能方法激活与检索入口词相关的术语或概念,为用户提供交互式的检索用语建议。方法的具体步骤包括文档和对象列表收集、对象过滤和自动标引、共现分析和联想检索四个阶段。这种方法多用于英文检索系统,但对我国的信息检索系统也有重要的借鉴意义。 相似文献
19.
基于EMM中文抽词算法的XMARC主题信息挖掘 总被引:4,自引:0,他引:4
本文在分词词典上采用区间最大词长,改进正向减字最大匹配法为“词首 长词匹配 短词推进”自动标引方法,从而有效地减少领域的分词歧义性和缩短标引时间。最后将该研究付诸于XMARC主题信息的挖掘与检索的实现,并证明其在时间和质量综合性能上的优越性。 相似文献
20.