首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于清华汉语树库的时间表达式抽取模型构建研究
引用本文:沈思,苏新宁,谢靖,王东波.基于清华汉语树库的时间表达式抽取模型构建研究[J].图书情报工作,2012,56(18):127-132.
作者姓名:沈思  苏新宁  谢靖  王东波
作者单位:南京大学信息管理学院信息技术开发研究所 南京 210093
基金项目:国家“863”计划项目“科技文献服务为主的搜索引擎研制”(项目编号:2011AA01A206);江苏省2012年度普通高校研究生科研创新计划项目“基于异构社会网络数据的信息集成与检索研究”(项目编号:CXZZ12_0073)研究成果之一
摘    要:基于清华汉语树库,利用条件随机场,构建时间表达式知识抽取模型。为了确保模型的性能,统计分析时间表达式的内部和外部特征,并把确定的特征应用到模型的构建中。在语言特征模板基础上,在摘要语料上抽取验证表明,时间表达式抽取模型的调和平均值最高达到80.83%。

关 键 词:清华汉语树库  时间表达式  条件随机场  特征模板  
收稿时间:2012-05-21

Construction of Temporal Expression Extraction Model Based on Tsinghua Chinese Treebank
Shen Si Su Xinning Xie Jing Wang Dongbo.Construction of Temporal Expression Extraction Model Based on Tsinghua Chinese Treebank[J].Library and Information Service,2012,56(18):127-132.
Authors:Shen Si Su Xinning Xie Jing Wang Dongbo
Institution:Institute of Information Technology Development, School of Information Management, Nanjing University, Nanjing 210093
Abstract:Using the Conditional Random Fields (CRF), the paper constructs the temporal expression extraction model based on Tsinghua Chinese Treebank. In order to ensure the performance of the model, the internal and external syntactic features are obtained and analyzed, and the definite features are applied to constructing the model. And this model is verified in the abstract corpus, the result shows that the best F-score of the temporal expression extraction model, which is obtained out of the template of the linguistic features, reaches up to 80.83%.
Keywords:Tsinghua Chinese treebank  temporal expression  conditional random fields  feature template  
本文献已被 CNKI 等数据库收录!
点击此处可从《图书情报工作》浏览原始摘要信息
点击此处可从《图书情报工作》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号