首页 | 本学科首页   官方微博 | 高级检索  
     检索      

当前知识抽取的主要技术方法解析*
引用本文:张智雄,吴振新,刘建华,徐健,洪娜,赵琦.当前知识抽取的主要技术方法解析*[J].现代图书情报技术,2008,24(8):2-11.
作者姓名:张智雄  吴振新  刘建华  徐健  洪娜  赵琦
作者单位:1. 中国科学院国家科学图书馆,北京,100190
2. 中国科学院国家科学图书馆,北京,100190;中国科学院研究生院,北京,100049
3. 中国科学院国家科学图书馆,北京,100190;中国科学院研究生院,北京,100049;中山大学资讯管理系,广州,510275
摘    要:

 对MnM、KIM、Text2Onto、Amilcare、Melita等具有知识抽取功能的系统所应用的技术方法进行解析。提出在当前知识抽取技术中,机器学习和自然语言分析两大思路各自得到较大发展,并且在相互融合、相互借鉴中受益。在基于机器学习的知识抽取方面,出现以自适应信息抽取(Adaptive IE)、开放信息抽取(Open IE)为代表的新思路,并且有向自动本体学习(Ontology Learning)方向发展的趋势;在基于自然语言分析的知识抽取方面,基于模式标注、语义标注的方法得到广泛关注和进一步完善,并且有向基于Ontology的信息抽取(OBIE)方向发展的趋势。此外,为减少Ontology建设成本,让人们可以利用简单的自然语言构建Ontology,基于受控语言的信息抽取(CLIE)技术也得到一定的关注。

关 键 词:知识抽取  机器学习  自然语言分析  本体
收稿时间:2008-06-16

Analysis of State-of-the-Art Knowledge Extraction Technologies
Zhang Zhixiong,Wu Zhenxin,Liu Jianhua,Xu Jian,Hong Na,Zhao Qi.Analysis of State-of-the-Art Knowledge Extraction Technologies[J].New Technology of Library and Information Service,2008,24(8):2-11.
Authors:Zhang Zhixiong  Wu Zhenxin  Liu Jianhua  Xu Jian  Hong Na  Zhao Qi
Institution:(National Science Library, Chinese Academy of Sciences, Beijing 100190, China) (Graduate University of the Chinese Academy of Sciences, Beijing 100049, China) (Department of Information Management,Sun Yat-Sen University, Guangzhou 510275, China)
Abstract:Based on the analysis of some state-of-the-art knowledge extraction systems,i.e.,MnM,KIM,Text2Onto,Amilcare and Melita,it brings forward that two kinds of technologies,i.e.,machine learning and natural language analysis,are developed respectively and get benefits from the inter-reference.On machine learning aspect,some new methods,such as Adaptive Information Extraction,Open Information Extraction,are put forward and have a trend toward Ontology Learning.On nature language analysis aspect,the methods of Pattern-Based Annotation and Semantic Annotation get more attention than ever,and have a trend toward Ontology Based Information Extraction.Besides,Controlled Language Information Extraction method is introduced to reduce the cost of Ontology Construction and allow non-specialists to create or edit ontological data using simple nature language.
Keywords:Knowledge extraction Machine learning Nature language analysis Ontology
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《现代图书情报技术》浏览原始摘要信息
点击此处可从《现代图书情报技术》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号