共查询到10条相似文献,搜索用时 93 毫秒
1.
同义关系是构建知识组织系统的重要方面。从词汇语义学角度对术语同义关系类型加以界定,采用词形还原工具Norm获得英文术语原形,获得同义词候选集,进而基于词形模糊归并模型确定同义关系。实验结果表明,基于词形的模糊归并有助于提高术语同义关系的构建效率。 相似文献
2.
基于词形的汉语文本切分方法 总被引:3,自引:0,他引:3
本文在分析汉语分词一般模型基础上,引入词形概率、词整合系数和词形网格等概念,提出了一个基于词形的汉语文本切分模型,并实现了一个反向动态规划和正向栈解码相结合的二次扫描的汉语文本切分算法。由于引入了词形概率、词整合系数,本模型不仅反映了词形统计构词规律,而且在一定程度上体现了长词优先的切分原则。初步测试表明,本方法的切分准确率和消歧率分别可达996%和9344%。 相似文献
3.
4.
基于词形规则模板的术语层次关系抽取方法 总被引:1,自引:0,他引:1
术语层次关系抽取是领域概念关系体系构建的重要基础.针对目前术语关系抽取中手工实现的问题,提出了基于词形规则模板匹配的术语层次关系抽取方法,实现从科技论文文本中抽取类属关系(IS-A)和整体部分关系(PART-OF)关系.利用复合术语的head和modifier特征,比较两个术语之间存在的边缘共用词汇,构造模板来确定它们之间的IS-A和PART-OF关系;提出泛化度指标,用于测量两个术语在概念层次树上的相对位置;提出相关度概念,用于测量两个术语之间在语义上的相关性.对不存在共用词汇和不匹配模板的术语采用泛化度差值和相关度来判断它们之间是否存在层次关系.实验从信息资源管理领域的论文文本中提取层次关系术语对1306对,准确率达到92.5%,证明提出的方法是有效的. 相似文献
5.
6.
7.
自组织映射用于数据分析的方法研究 总被引:1,自引:1,他引:0
自组织映射(SOM)是一种人工神经网络方法,它通过将相似的输入数据映射到相同或相近结点,将高维输入数据显示在低维空间中,具有保留输入数据的拓扑结构的优点,便于用户观察数据的分布特点.数据分析是SOM的重要应用领域之一.本文分析了SOM的各种学习算法(包括序列学习、批学习、k-batch学习、将空间访问方法引入SOM等算法)的优缺点和适用情况,挖掘了不同的SOM输出维度、结点形状及输出大小,并分析了三种成熟的SOM工具(SOM Toolbox, Viscovery SOMine和Databionic ESOM Tools)对这些算法、输出形式的支持程度,为SOM用于数据分析提供了细化而适当的方法借鉴. 相似文献
8.
在简要介绍本体评价的层次及内容的基础上,结合场景特点,深入分析比较几种常见的评价方法、评价工具等,最后从宏观层面分析存在的问题,指出今后本领域的研究方向。 相似文献
9.
10.
介绍命名实体识别的基本概念,分析两种命名实体识别的基本方法:基于规则的命名实体识别方法和基于统计的命名实体识别方法,并以最大熵模型为理论基础,对中文菜名识别进行实证研究。根据中文命名实体的特点,设计6种特征模板。实验结果表明,在简单特征模板的基础上增加标注特征能有效提高命名实体的识别效果。对改进识别效果有用的特征依次为:标注特征、词性组合特征、后向词性依赖特征和词形特征。 相似文献