首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于百科资源的多策略中文同义词自动抽取研究
引用本文:陆勇,章成志,侯汉清.基于百科资源的多策略中文同义词自动抽取研究[J].中国图书馆学报,2010,36(1).
作者姓名:陆勇  章成志  侯汉清
作者单位:1. 南京信息工程大学,210044
2. 南京理工大学信息管理系,210094
基金项目:中国博士后科学基金特别资助项目(项目标号:200801105); 国家科技支撑计划重点项目(项目编号:2006BAH03B02)“科技文献信息服务系统关键技术研究及应用示范项目”子课题; 教育部人文社会科学研究一般项目(项目编号:08JC870007)研究成果之一
摘    要:采用实证的方法,以百度百科语料库为实验抽取对象,在对同义词自动抽取技术分析比较的基础上,提出了多策略的中文同义词抽取的思路.综合利用字面相似度方法、特征模式匹配方法和PageRank链接分析方法对中文百科语料库中的同义词进行自动获取,具有多领域适用性、获取同义词类型多样性等特点.实验结果表明,该方法具有可行性,并可应用于其它语种的同义词自动获取中.未来的研究应进一步实现模式的自动定义、完善抽词词典、有效排除噪音数据并构建能真实反映语义关系的词汇矩阵.图1.表6.参考文献13.

关 键 词:信息抽取  中文同义词  同义词抽取  百科语料库

Using Multiple Hybrid Strategies to Extract Chinese Synonyms from Encyclopedia ResourcesJournal of Library Science in China
Lu Yong,Zhang Chengzhi and Hou Hanqing.Using Multiple Hybrid Strategies to Extract Chinese Synonyms from Encyclopedia ResourcesJournal of Library Science in China[J].Journal of Library Science In China,2010,36(1).
Authors:Lu Yong  Zhang Chengzhi and Hou Hanqing
Abstract:The automatic extraction of Chinese synonyms plays an important role in information retrieval and semantic resource construction.Based on analyzing and comparing the different techniques of synonym extraction,this paper proposes a multi-strategic method consisting of literal similarity algorithm,pattern matching algorithm and PageRank algorithm to extract Chinese synonyms from encyclopedia resources.The method supports any domain and is able to extract synonyms in various expressions.The result of experimen...
Keywords:Synonyms extraction  Chinese synonyms  Information extraction  Encyclopedia knowledge  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《中国图书馆学报》浏览原始摘要信息
点击此处可从《中国图书馆学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号