首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于混合方法的多语言多文档自动摘要系统构建及实现
引用本文:柯修,王惠临.基于混合方法的多语言多文档自动摘要系统构建及实现[J].图书馆学研究,2013(2):66-72.
作者姓名:柯修  王惠临
作者单位:北京大学信息管理系;中国科学技术信息研究所
基金项目:中国科学技术信息研究所学科建设项目“自然语言处理”(项目编号:XK2012-6)的研究成果之一
摘    要:文章基于"指代消解"、"文本外部特征"、"图排序"的混合方法实现多语言多文档新闻摘要系统。该系统由四大模块组成,分别为:原文预处理;基于文本外部特征的摘要计算;基于图排序的摘要计算与;摘要生成模块。首先对新闻文本进行预处理和指代消解,然后在第二模块使用文本外部特征(如:主题词、线索词语、关键词与其同义词、时间、地点、命名实体等)来计算原文中句子的重要程度,句子与新闻主题的相关度,并且对每个句子第一次打分。然后在第三模块采用图排序的算法再从原文中计算句子之间的连贯程度,并且第二次对每个句子打分。最后在第四模块通过两个不同算法的得分计算原文中句子的总得分并且按原文中句子出现的顺序摘出新闻文本的摘要。文章以汉语、英语、孟加拉语为例,实现该系统并进行摘要测试。实验表明系统能够从三个不同语种的多文档新闻文本中有效地摘出摘要。

关 键 词:多语言自动摘要  多文档自动摘要  图排序算法  文本外部特征

Multilingual Multi-Document Automatic Text Summarization System Implementation Based on a Hybrid Approach
Kishore Biswas Wang Huilin.Multilingual Multi-Document Automatic Text Summarization System Implementation Based on a Hybrid Approach[J].Researches in Library Science,2013(2):66-72.
Authors:Kishore Biswas Wang Huilin
Institution:Kishore Biswas Wang Huilin
Abstract:
Keywords:
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号