首页 | 本学科首页   官方微博 | 高级检索  
     检索      

中文叙词表本体概念定义注释的自动构建研究
引用本文:田金凤,曾新红,黄华军,林伟明.中文叙词表本体概念定义注释的自动构建研究[J].现代图书情报技术,2011(11):9-16.
作者姓名:田金凤  曾新红  黄华军  林伟明
作者单位:深圳大学计算机与软件学院;深圳大学图书馆;
基金项目:广东省哲学社会科学“十一五”规划项目“中文知识组织系统的形式化语义描述标准体系研究”(编号GD10CTS02); 广东省自然科学基金团队项目“新型计算模式及其软件开发方法研究”(编号:10351806001000000)的研究成果之一
摘    要:设计面向综合性中文叙词表本体的叙词概念定义抽取方法,获得良好的实验效果并已投入实际应用。其中,基于"高频词与句子向量"和"TF*IDF向量"两种定义抽取算法提出的二维相对量的融合算法,能够更有效地抽取出前两种方法的良好结果,有效信息提高比一般可达到60%。

关 键 词:中文叙词表本体  OTCSS定义抽取  向量空间模型  高频词与句子向量  TF*IDF向量  二维相对量

Research on Automatic Construction of Definition Notes for Concepts in OntoThesaurus
Tian Jinfeng Zeng Xinhong Huang Huajun Lin Weiming.Research on Automatic Construction of Definition Notes for Concepts in OntoThesaurus[J].New Technology of Library and Information Service,2011(11):9-16.
Authors:Tian Jinfeng Zeng Xinhong Huang Huajun Lin Weiming
Institution:Tian Jinfeng~1 Zeng Xinhong~(1,2) Huang Huajun~2 Lin Weiming~2 1(College of Computer and Software,Shenzhen University,Shenzhen 518060,China) 2(Shenzhen University Library,China)
Abstract:The paper proposes some methods of definition extraction for concepts in the comprehensive OntoThesaurus. They achieve good experiment effects and are applied to the actual OTCSS.Among them,an integrated algorithm named two-dimensional relative quantity based on high-frequency words vector'and TF*IDF vectoris presented.This algorithm can much effectively extract good results from that of the first two methods,and the effective information improving ratio can reach 60%generally.
Keywords:OntoThesaurus OTCSS Definition extraction VSM High-frequency words vector TF * IDF vector Two-dimensional relative quantity  
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号