首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 93 毫秒
1.
同义关系是构建知识组织系统的重要方面。从词汇语义学角度对术语同义关系类型加以界定,采用词形还原工具Norm获得英文术语原形,获得同义词候选集,进而基于词形模糊归并模型确定同义关系。实验结果表明,基于词形的模糊归并有助于提高术语同义关系的构建效率。  相似文献   

2.
基于词形的汉语文本切分方法   总被引:3,自引:0,他引:3  
本文在分析汉语分词一般模型基础上,引入词形概率、词整合系数和词形网格等概念,提出了一个基于词形的汉语文本切分模型,并实现了一个反向动态规划和正向栈解码相结合的二次扫描的汉语文本切分算法。由于引入了词形概率、词整合系数,本模型不仅反映了词形统计构词规律,而且在一定程度上体现了长词优先的切分原则。初步测试表明,本方法的切分准确率和消歧率分别可达996%和9344%。  相似文献   

3.
首先,论述词干提取和语言形态学的关系。其次,对词干提取的主要算法和相关技术进行详细分类。而后,对词干提取方法的主要特点进行分析并对各类方法的优点、缺点和特点进行对比,并归纳实现词干提取功能的工具及其特点。最后,对词干提取研究的现有问题和未来发展趋势进行探讨。  相似文献   

4.
基于词形规则模板的术语层次关系抽取方法   总被引:1,自引:0,他引:1  
术语层次关系抽取是领域概念关系体系构建的重要基础.针对目前术语关系抽取中手工实现的问题,提出了基于词形规则模板匹配的术语层次关系抽取方法,实现从科技论文文本中抽取类属关系(IS-A)和整体部分关系(PART-OF)关系.利用复合术语的head和modifier特征,比较两个术语之间存在的边缘共用词汇,构造模板来确定它们之间的IS-A和PART-OF关系;提出泛化度指标,用于测量两个术语在概念层次树上的相对位置;提出相关度概念,用于测量两个术语之间在语义上的相关性.对不存在共用词汇和不匹配模板的术语采用泛化度差值和相关度来判断它们之间是否存在层次关系.实验从信息资源管理领域的论文文本中提取层次关系术语对1306对,准确率达到92.5%,证明提出的方法是有效的.  相似文献   

5.
《新闻天地》2002,(6):61-64
1、范围本规范是推荐性试行规范。根据"积极稳妥、循序渐进、区别对待、分批整理"的工作方针,选取了普通话书面语中经常使用,公众的取舍倾向比较明显的338组(不含附录中的44组)异形词(包括词和固定短语),作为第一批进行整理,给出了每组异形词的推荐使用词形。本规范适用于普通话书面语,包括语文教学、新闻出版、辞书编纂、信息处理等方面。 2、规范性引用文件第一批异体字整理表(1955年12月22日中华人民共和国文化部、中国文字改革委员会发布) 汉语拼音方案(1958年2月11日中华人民共和国第一届全国人民代表大会第五次会议批准)  相似文献   

6.
基于加权语义网的专家知识发现及表示方法   总被引:1,自引:0,他引:1  
在分析传统的以词形为切入点来建立知识内在关联的基础上,从语义网络的角度对专家知识发现及表示方法进行了研究.在语义关系建模时,综合考虑知识元的语义关系及其在文本中的重要性,提出了知识加权语义网(WSNK),从而实现专家知识的准确获取和表示.该方法可通过网络图表示专家知识的构成、通过语义描述专家知识领域等,具有客观、准确、易于理解等特点.最后结合一个实例对方法进行了验证和分析,结果表明,该方法能够客观、准确地理解和表示专家的知识.  相似文献   

7.
自组织映射用于数据分析的方法研究   总被引:1,自引:1,他引:0  
自组织映射(SOM)是一种人工神经网络方法,它通过将相似的输入数据映射到相同或相近结点,将高维输入数据显示在低维空间中,具有保留输入数据的拓扑结构的优点,便于用户观察数据的分布特点.数据分析是SOM的重要应用领域之一.本文分析了SOM的各种学习算法(包括序列学习、批学习、k-batch学习、将空间访问方法引入SOM等算法)的优缺点和适用情况,挖掘了不同的SOM输出维度、结点形状及输出大小,并分析了三种成熟的SOM工具(SOM Toolbox, Viscovery SOMine和Databionic ESOM Tools)对这些算法、输出形式的支持程度,为SOM用于数据分析提供了细化而适当的方法借鉴.  相似文献   

8.
在简要介绍本体评价的层次及内容的基础上,结合场景特点,深入分析比较几种常见的评价方法、评价工具等,最后从宏观层面分析存在的问题,指出今后本领域的研究方向。  相似文献   

9.
提出一种基于英汉术语语义推导和归并的术语自动分类方法。以英汉术语库为基本语料,通过语义传导和词形规范为英文术语自动推荐候选分类,进而采用投票机制对推荐结果进行遴选和归并。实验结果表明,本方法对英文术语自动分类的准确率较高,具有一定的应用价值。  相似文献   

10.
介绍命名实体识别的基本概念,分析两种命名实体识别的基本方法:基于规则的命名实体识别方法和基于统计的命名实体识别方法,并以最大熵模型为理论基础,对中文菜名识别进行实证研究。根据中文命名实体的特点,设计6种特征模板。实验结果表明,在简单特征模板的基础上增加标注特征能有效提高命名实体的识别效果。对改进识别效果有用的特征依次为:标注特征、词性组合特征、后向词性依赖特征和词形特征。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号