首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于双序列比对的中文术语语义相似度计算的新方法
引用本文:徐硕,朱礼军,乔晓东,薛春香.基于双序列比对的中文术语语义相似度计算的新方法[J].情报学报,2010,29(4).
作者姓名:徐硕  朱礼军  乔晓东  薛春香
作者单位:1. 中国科学技术信息研究所,北京,100038
2. 中国科学技术信息研究所,北京,100038;南京理工大学,南京,210094
基金项目:"十一五"国家科技支撑计划"知识组织系统的集成及服务研究与实现",中国科学技术信息研究所重点工作项目"汉语科技词系统建设与应用工程(新能源汽车领域)" 
摘    要:针对中文术语的语义相似度计算问题,本文首先用数学语言对其进行了描述,然后仔细分析了求解该问题的传统计算方法,结果发现传统计算方法大都做了一个隐式假设:组成两个术语的原子术语的顺序必须大体一致.换句话说,传统计算方法并没有考虑原子术语顺序的差异对构建两个术语的原子术语间对应关系质量的影响.为克服这个问题,通过类比分析,本文认为可将该问题看作一个全局双序列比对问题,因而引入生物信息学领域中著名的全局双序列比对算法(NW算法).理论及实验研究均表明,在绝大多数情况下,该方法优于传统方法,或至少与传统方法的效果相当.

关 键 词:语义相似度计算  序列比对  语义知识库

A Novel Approach to Chinese Terms Semantic Similarity Calculation Based on Pairwise Sequence Alignment
Xu Shuo,Zhu Lijun,Qiao Xiaodong,Xue Chunxiang.A Novel Approach to Chinese Terms Semantic Similarity Calculation Based on Pairwise Sequence Alignment[J].Journal of the China Society for Scientific andTechnical Information,2010,29(4).
Authors:Xu Shuo  Zhu Lijun  Qiao Xiaodong  Xue Chunxiang
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号