共查询到20条相似文献,搜索用时 431 毫秒
1.
2.
3.
KOS互操作中的术语映射研究综述* 总被引:2,自引:0,他引:2
总结基于词形、基于结构和基于语料的术语映射方法,阐述术语映射关系的主要类型,对术语映射中的映射方向性、映射不一致性、映射关系传递性、人工映射与自动映射相结合等相关问题进行简单讨论。 相似文献
4.
总结缩略语的3个特点,即全称多样性、来源多样性、形式多样性,并对《英文超级科技词表》中同义术语归并时缩略语的处理方法进行研究,归纳出直接同全称对应归并处理、添加全称限制、添加范畴限制、基于词频大小选择性归并等4种处理方法;讨论叙词表中缩略语作为优选词和非优选词的原则、缩略语对检全率和检准率的影响以及缩略语范畴号重复性等问题。 相似文献
5.
6.
基于词形规则模板的术语层次关系抽取方法 总被引:1,自引:0,他引:1
术语层次关系抽取是领域概念关系体系构建的重要基础.针对目前术语关系抽取中手工实现的问题,提出了基于词形规则模板匹配的术语层次关系抽取方法,实现从科技论文文本中抽取类属关系(IS-A)和整体部分关系(PART-OF)关系.利用复合术语的head和modifier特征,比较两个术语之间存在的边缘共用词汇,构造模板来确定它们之间的IS-A和PART-OF关系;提出泛化度指标,用于测量两个术语在概念层次树上的相对位置;提出相关度概念,用于测量两个术语之间在语义上的相关性.对不存在共用词汇和不匹配模板的术语采用泛化度差值和相关度来判断它们之间是否存在层次关系.实验从信息资源管理领域的论文文本中提取层次关系术语对1306对,准确率达到92.5%,证明提出的方法是有效的. 相似文献
7.
8.
以中小学简介信息分类为例,在分析该类数据特征项少、权重不均等特点的基础上,采用去噪处理、基于模糊集的同义处理等策略构建类别特征库,并以特征库为依据,使用模糊规则构建分类模型,实现对短文本数据的分类。实验结果表明:对于类别特征项较少、权值分布不均的短文本分类,模糊规则分类优于VSM、Rocchio等分类算法。 相似文献
9.
数据驱动下,与日俱增的电子政务信息资源愈发表现出多源异构的特性,基于大规模语料设计一套电子政务领域内中文术语深度层次关系的自动化识别方案,不仅有利于从内容与结构层面弥补人工构建领域词表的不足,且对于我国政务信息资源的开放共享与后续应用更具有重大现实意义。因此,本文分别基于内容与结构双重视角识别电子政务主题词表内术语间的深层关联,通过谱聚类生成的基于内容的层次关系为初步框架,凭借形式概念分析生成的基于结构的层次关系为后期修正指导,以期构成兼顾关联术语召回率与准确率的电子政务领域术语本体。研究结果显示,电子政务术语本体的层次结构合理有效,且术语层次关系的评价结果表明知识本体具备良好的扩展性和延伸性。 相似文献
10.
图书标引是图书检索的前提和基础,把图书或摘要标引成概念图的形式,将有利于满足基于自然语言表述的图书检索需求。从科技类文献摘要出发,通过手工标引,总结常用的概念间关系作为概念图标注的关系集合,结合叙词表构造术语部件库,以便辅助术语识别,用MBL方法进行概念关系构建,在此基础上,提出了一个概念图生成算法,并开发了一个概念图半自动标引的实验原型系统。原型系统的实验表明,该种概念图半自动标引方法获得了较高的正确率。 相似文献
11.
高等师范院校合并后图书馆文献资源建设的思考 总被引:3,自引:0,他引:3
高等师范院校的合并必然带来图书馆的合并,并给图书馆的文献资源建设带来影响,本文就合并后高等师范院校图书馆文献资源建设工作中必须处理好的关系、文献资源建设的主要原则以及主要措施等问题进行分析讨论。 相似文献
12.
基于改进编辑距离的相似重复记录清理算法 总被引:1,自引:0,他引:1
相似度计算是相似重复记录清理过程中的一个关键问题,编辑距离算法在其中具有广泛应用。在传统编辑距离算法的基础上,通过分析影响相似度计算结果的序列长度、同义词等因素,得到一种同时引入同义词词库和归一化处理思想的改进的基于语义编辑距离的相似重复记录清理算法,适用于相似记录的识别过程。实验分析表明,改进算法计算结果更符合句子的语义信息,绝大部分结果符合人们的认知经验,从而可以有效地提高相似重复记录识别的准确率和精确度。 相似文献
13.
基于模式匹配的汉语同义词自动识别 总被引:7,自引:0,他引:7
同义词的自动发现和识别在信息检索领域有着重要的研究意义和应用价值。为了提高同义词自动识别的效率,本文提出了从词典释义中使用模式匹配方法提取同义词。该方法首先对词汇的释义方式进行分析,归纳总结出在词典释义中同义词出现的模式,进而利用模式匹配方法获取同义词。实验结果表明,利用模式匹配方法来自动发现同义词具有可行性和实用性。 相似文献
14.
从互联网中搜索同义词具有非常重要的理论意义和应用意义,但同时也存在一词多义情况下无法对不同词义的同义词进行区分的问题。针对这一问题,提出一种对互联网同义词搜索结果按照词义聚类的方法,该方法利用术语间的词义关系转化为图结构,实现词义自动聚类,无需人工干预和学科领域知识,能够达到较高的聚类准确性。 相似文献
15.
本文以"非典型肺炎"和"甲型H1N1流感"两个传染病作为研究样本,以中国知网(CNKI)数据库中的文献关键词作为语料库来源,基于用户关键词词频统计,并结合人工核查,分析同一概念的同义词和近义词以确立关键词词间的等同关系。目的是了解用户关键词和MeSH主题词之间的差异,分析用户表达偏好和习惯,进而为叙词表维护中的候选词汇选择提供一定的参考。 相似文献
16.
17.
我国机构知识库研究现状分析 总被引:3,自引:0,他引:3
本文对我国截止到2009年4月为止的机构知识库相关研究论文进行了调查.首先从论文的发文量、作者、机构、来源期刊等方面进行统计分析.结果表明:我国机构知识库研究自2004年起步以来已发表146篇学术论文,13位高产作者主要分布在中国科学院国家科学图书馆与高校图书馆和图书情报学科,约1/3论文集中刊登在以<图书情报工作>、<现代情报>为代表的三种学术期刊上;其次对论文中作者给出的关键词,在同义词归类和替换的基础上进行排序后析出10大热点关键词;最后对论文研究内容进行了深入分析和归类,认为机构知识库构建的实证研究应该成为今后的研究重点. 相似文献
18.
Petros Iosifidis 《媒体管理杂志》2013,15(3-4):103-111
This article examines whether European Commission (EC) competition policy and merger control provisions can prevent excessive market power and safeguard open access and consumer choice in the European media and communications industry. The study looks at the structure of the media industry and points to the amalgamation of corporate power. It assesses whether EC competition law and merger provisions can effectively address the dangers of ownership concentration and safeguard diversity of sources. A number of merger cases either blocked or allowed by the EC are reviewed to establish the level of competition. The article suggests that a more rigorous competition policy is required to guarantee competition and prevent domination in merger activity. 相似文献
19.
In the patent domain significant efforts are invested to assist researchers in formulating better queries, preferably via automated query expansion. Currently, automatic query expansion in patent search is mostly limited to computing co-occurring terms for the searchable features of the invention. Additional query terms are extracted automatically from patent documents based on entropy measures. Learning synonyms in the patent domain for automatic query expansion has been a difficult task. No dedicated sources providing synonyms for the patent domain, such as patent domain specific lexica or thesauri, are available. In this paper we focus on the highly professional search setting of patent examiners. In particular, we use query logs to learn synonyms for the patent domain. For automatic query expansion, we create term networks based on the query logs specifically for several USPTO patent classes. Experiments show good performance in automatic query expansion using these automatically generated term networks. Specifically, with a larger number of query logs for a specific patent US class available the performance of the learned term networks increases. 相似文献
20.
[目的/意义] 鉴于目前同义词抽取方法无法避免抽取结果含有较多的噪音,需要较高的人工代价去除噪音,提出一种对同义词抽取结果排序的方法,使得正确结果排序提前,以达到提高抽取结果准确性及降低人工去噪代价的目的。[方法/过程] 将抽取结果转化为抽取关系有向图,基于该有向图计算抽取结果中每个词汇与被抽取词汇的词义相似性,并按照词义相似性高低进行排序。排序方法的最大特点是只利用了当前的同义词抽取方法,不需要人工参与和额外的语义知识。[结果/结论] 通过在真实数据集上进行验证,得出排序效果与抽取结果的规模呈正向关系的论点,即一个给定词汇的同义词抽取结果数量越多,排序的效果就会越好。 相似文献