首页 | 本学科首页   官方微博 | 高级检索  
     检索      

LCS算法在术语抽取中的应用研究
引用本文:潘虹,徐朝军.LCS算法在术语抽取中的应用研究[J].情报学报,2010,29(5).
作者姓名:潘虹  徐朝军
作者单位:南京师范大学教育技术系,南京,210097
摘    要:本文介绍了一种基于最大公共子串(Longest Common Substring,LCS)算法的术语抽取方法:按标点符号对领域文档进行切分;抽取切分后的语句片断的所有最大公共子串作为候选术语集;通过停用词过滤、对照领域词筛选和术语嵌套子串筛选等规则进行判别,得到最终的术语集.通过学前教育领域术语抽取的实验,验证了该算法可以有效地抽取中文领域术语:术语抽取平均准确率达84.2%;4~6字符双词术语抽取的效果尤佳,准确率接近100%.

关 键 词:最大公共子串算法  术语抽取

Application of LCS-Based Algorithm in Chinese Term Extraction
Pan Hong,Xu Chaojun.Application of LCS-Based Algorithm in Chinese Term Extraction[J].Journal of the China Society for Scientific andTechnical Information,2010,29(5).
Authors:Pan Hong  Xu Chaojun
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号