首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 431 毫秒
1.
提出一种基于英汉术语语义推导和归并的术语自动分类方法。以英汉术语库为基本语料,通过语义传导和词形规范为英文术语自动推荐候选分类,进而采用投票机制对推荐结果进行遴选和归并。实验结果表明,本方法对英文术语自动分类的准确率较高,具有一定的应用价值。  相似文献   

2.
UMLS多词表整合机制研究   总被引:1,自引:0,他引:1  
文章基于对UMLS超级叙词表、语义网、专家辞典的分析,及对UMLS系统结构和数据的解析,重最探讨UMLS多来源词表同义概念的归并机制、异构异质词表术语、关系、属性信息的集成方法,以及范畴体系的构建理念,最后就UMLS多词表整合策略进行讨论。  相似文献   

3.
KOS互操作中的术语映射研究综述*   总被引:2,自引:0,他引:2  
总结基于词形、基于结构和基于语料的术语映射方法,阐述术语映射关系的主要类型,对术语映射中的映射方向性、映射不一致性、映射关系传递性、人工映射与自动映射相结合等相关问题进行简单讨论。  相似文献   

4.
总结缩略语的3个特点,即全称多样性、来源多样性、形式多样性,并对《英文超级科技词表》中同义术语归并时缩略语的处理方法进行研究,归纳出直接同全称对应归并处理、添加全称限制、添加范畴限制、基于词频大小选择性归并等4种处理方法;讨论叙词表中缩略语作为优选词和非优选词的原则、缩略语对检全率和检准率的影响以及缩略语范畴号重复性等问题。  相似文献   

5.
提出一种利用翻译词对信息快速构建知识组织系统中术语之间同义关系的方法:利用单词条的翻译数量、翻译共现强度等作为基本输入,通过简单布尔判断、条件互信息或向量空间模型余弦相似度来计算术语之间的相似度,进而发现并构建同义关系;采用准确率和丰富率来评价构建效果,通过在新能源汽车领域进行实验,发现该方法不但速度快,而且在翻译信息比较丰富的条件下,对于中文同义关系构建有较好效果。  相似文献   

6.
基于词形规则模板的术语层次关系抽取方法   总被引:1,自引:0,他引:1  
术语层次关系抽取是领域概念关系体系构建的重要基础.针对目前术语关系抽取中手工实现的问题,提出了基于词形规则模板匹配的术语层次关系抽取方法,实现从科技论文文本中抽取类属关系(IS-A)和整体部分关系(PART-OF)关系.利用复合术语的head和modifier特征,比较两个术语之间存在的边缘共用词汇,构造模板来确定它们之间的IS-A和PART-OF关系;提出泛化度指标,用于测量两个术语在概念层次树上的相对位置;提出相关度概念,用于测量两个术语之间在语义上的相关性.对不存在共用词汇和不匹配模板的术语采用泛化度差值和相关度来判断它们之间是否存在层次关系.实验从信息资源管理领域的论文文本中提取层次关系术语对1306对,准确率达到92.5%,证明提出的方法是有效的.  相似文献   

7.
以英文同义术语为例,提出三种有效的自动获取互联网术语资源的技术手段,包括语法模式的自学习,在线同义词典的抽取,静态同义术语分类的爬取。在此基础上,设计并实现互联网同义术语检索原型系统(Web Synonym Searcher)。实验测试表明,从互联网中自动获取同义术语是一种非常有前景的途径。  相似文献   

8.
以中小学简介信息分类为例,在分析该类数据特征项少、权重不均等特点的基础上,采用去噪处理、基于模糊集的同义处理等策略构建类别特征库,并以特征库为依据,使用模糊规则构建分类模型,实现对短文本数据的分类。实验结果表明:对于类别特征项较少、权值分布不均的短文本分类,模糊规则分类优于VSM、Rocchio等分类算法。  相似文献   

9.
数据驱动下,与日俱增的电子政务信息资源愈发表现出多源异构的特性,基于大规模语料设计一套电子政务领域内中文术语深度层次关系的自动化识别方案,不仅有利于从内容与结构层面弥补人工构建领域词表的不足,且对于我国政务信息资源的开放共享与后续应用更具有重大现实意义。因此,本文分别基于内容与结构双重视角识别电子政务主题词表内术语间的深层关联,通过谱聚类生成的基于内容的层次关系为初步框架,凭借形式概念分析生成的基于结构的层次关系为后期修正指导,以期构成兼顾关联术语召回率与准确率的电子政务领域术语本体。研究结果显示,电子政务术语本体的层次结构合理有效,且术语层次关系的评价结果表明知识本体具备良好的扩展性和延伸性。  相似文献   

10.
图书标引是图书检索的前提和基础,把图书或摘要标引成概念图的形式,将有利于满足基于自然语言表述的图书检索需求。从科技类文献摘要出发,通过手工标引,总结常用的概念间关系作为概念图标注的关系集合,结合叙词表构造术语部件库,以便辅助术语识别,用MBL方法进行概念关系构建,在此基础上,提出了一个概念图生成算法,并开发了一个概念图半自动标引的实验原型系统。原型系统的实验表明,该种概念图半自动标引方法获得了较高的正确率。  相似文献   

11.
高等师范院校合并后图书馆文献资源建设的思考   总被引:3,自引:0,他引:3  
章赛君 《图书馆》2005,(4):102-105
高等师范院校的合并必然带来图书馆的合并,并给图书馆的文献资源建设带来影响,本文就合并后高等师范院校图书馆文献资源建设工作中必须处理好的关系、文献资源建设的主要原则以及主要措施等问题进行分析讨论。  相似文献   

12.
基于改进编辑距离的相似重复记录清理算法   总被引:1,自引:0,他引:1  
相似度计算是相似重复记录清理过程中的一个关键问题,编辑距离算法在其中具有广泛应用。在传统编辑距离算法的基础上,通过分析影响相似度计算结果的序列长度、同义词等因素,得到一种同时引入同义词词库和归一化处理思想的改进的基于语义编辑距离的相似重复记录清理算法,适用于相似记录的识别过程。实验分析表明,改进算法计算结果更符合句子的语义信息,绝大部分结果符合人们的认知经验,从而可以有效地提高相似重复记录识别的准确率和精确度。  相似文献   

13.
基于模式匹配的汉语同义词自动识别   总被引:7,自引:0,他引:7  
陆勇  侯汉清 《情报学报》2006,25(6):720-724
同义词的自动发现和识别在信息检索领域有着重要的研究意义和应用价值。为了提高同义词自动识别的效率,本文提出了从词典释义中使用模式匹配方法提取同义词。该方法首先对词汇的释义方式进行分析,归纳总结出在词典释义中同义词出现的模式,进而利用模式匹配方法获取同义词。实验结果表明,利用模式匹配方法来自动发现同义词具有可行性和实用性。  相似文献   

14.
刘伟 《图书情报工作》2013,57(16):15-19
从互联网中搜索同义词具有非常重要的理论意义和应用意义,但同时也存在一词多义情况下无法对不同词义的同义词进行区分的问题。针对这一问题,提出一种对互联网同义词搜索结果按照词义聚类的方法,该方法利用术语间的词义关系转化为图结构,实现词义自动聚类,无需人工干预和学科领域知识,能够达到较高的聚类准确性。  相似文献   

15.
本文以"非典型肺炎"和"甲型H1N1流感"两个传染病作为研究样本,以中国知网(CNKI)数据库中的文献关键词作为语料库来源,基于用户关键词词频统计,并结合人工核查,分析同一概念的同义词和近义词以确立关键词词间的等同关系。目的是了解用户关键词和MeSH主题词之间的差异,分析用户表达偏好和习惯,进而为叙词表维护中的候选词汇选择提供一定的参考。  相似文献   

16.
熊霞  常春 《图书情报工作》2010,54(12):50-108
通过调查总结叙词表在文献数据库中的应用现状,在此基础上设计一个基于叙词表的文献数据库知识单元检索系统。该系统首先将数据库中的文献分解为知识单元,检索时用叙词表中的正式叙词对用户输入的检索词进行规范化处理,并将该正式叙词作为中心词,利用叙词表中的词间关系查找出该词的等同词、上下位词和相关词作为扩展检索词,对知识单元进行加权检索,按权值之和以及检索词的密集程度排序输出。经实例分析,具有可行性。  相似文献   

17.
我国机构知识库研究现状分析   总被引:3,自引:0,他引:3  
本文对我国截止到2009年4月为止的机构知识库相关研究论文进行了调查.首先从论文的发文量、作者、机构、来源期刊等方面进行统计分析.结果表明:我国机构知识库研究自2004年起步以来已发表146篇学术论文,13位高产作者主要分布在中国科学院国家科学图书馆与高校图书馆和图书情报学科,约1/3论文集中刊登在以<图书情报工作>、<现代情报>为代表的三种学术期刊上;其次对论文中作者给出的关键词,在同义词归类和替换的基础上进行排序后析出10大热点关键词;最后对论文研究内容进行了深入分析和归类,认为机构知识库构建的实证研究应该成为今后的研究重点.  相似文献   

18.
This article examines whether European Commission (EC) competition policy and merger control provisions can prevent excessive market power and safeguard open access and consumer choice in the European media and communications industry. The study looks at the structure of the media industry and points to the amalgamation of corporate power. It assesses whether EC competition law and merger provisions can effectively address the dangers of ownership concentration and safeguard diversity of sources. A number of merger cases either blocked or allowed by the EC are reviewed to establish the level of competition. The article suggests that a more rigorous competition policy is required to guarantee competition and prevent domination in merger activity.  相似文献   

19.
In the patent domain significant efforts are invested to assist researchers in formulating better queries, preferably via automated query expansion. Currently, automatic query expansion in patent search is mostly limited to computing co-occurring terms for the searchable features of the invention. Additional query terms are extracted automatically from patent documents based on entropy measures. Learning synonyms in the patent domain for automatic query expansion has been a difficult task. No dedicated sources providing synonyms for the patent domain, such as patent domain specific lexica or thesauri, are available. In this paper we focus on the highly professional search setting of patent examiners. In particular, we use query logs to learn synonyms for the patent domain. For automatic query expansion, we create term networks based on the query logs specifically for several USPTO patent classes. Experiments show good performance in automatic query expansion using these automatically generated term networks. Specifically, with a larger number of query logs for a specific patent US class available the performance of the learned term networks increases.  相似文献   

20.
刘伟 《图书情报工作》2015,59(12):128-134
[目的/意义] 鉴于目前同义词抽取方法无法避免抽取结果含有较多的噪音,需要较高的人工代价去除噪音,提出一种对同义词抽取结果排序的方法,使得正确结果排序提前,以达到提高抽取结果准确性及降低人工去噪代价的目的。[方法/过程] 将抽取结果转化为抽取关系有向图,基于该有向图计算抽取结果中每个词汇与被抽取词汇的词义相似性,并按照词义相似性高低进行排序。排序方法的最大特点是只利用了当前的同义词抽取方法,不需要人工参与和额外的语义知识。[结果/结论] 通过在真实数据集上进行验证,得出排序效果与抽取结果的规模呈正向关系的论点,即一个给定词汇的同义词抽取结果数量越多,排序的效果就会越好。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号