首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种有效的多文档文摘语义空间降维方法
引用本文:张先飞,刘嵩,韩永峰,孙显著.一种有效的多文档文摘语义空间降维方法[J].情报学报,2011,28(3).
作者姓名:张先飞  刘嵩  韩永峰  孙显著
作者单位:1. 解放军信息工程大学信息工程学院,郑州,450002
2. 72495,部队,郑州,450002
基金项目:国家高技术研究发展计划(863)资助项目
摘    要:基于多文档集合特征的多文档文摘生成方法在选取最优词时利用人工进行特征降维,方法过于机械,同时在回溯词鄄文档矩阵进行文本相似度计算时,存在对稀疏矩阵无法计算的问题.本文对话题追踪结果进行多文档文摘研究,提出一种有效的多文档文摘语义空间降维方法.新方法在整个话题范围内构造语义空间词鄄文档矩阵,采用奇异值分解对原始词鄄文档矩阵进行特征降维,同时构造能充分包含原始文档词汇信息且维数低的转换矩阵F,利用它来回溯词鄄文档矩阵,完成低维空间下的词相似度计算,进而完成文本单元相似度计算以及文本单元聚类,最终生成多文档自动文摘.实验结果表明,该方法能够对语义空间词鄄文档矩阵进行完美降维,同时避免稀疏矩阵无法计算的问题,对最终生成的多文档文摘有着很好的效果.

关 键 词:语义空间  多文档文摘  特征降维  奇异值分解  聚类

An Efficient Semantic-Space Dimension Reduction Method for Multi-document Summarization
Zhang Xianfei,Liu Song,Han Yongfeng,Sun Xianzhu.An Efficient Semantic-Space Dimension Reduction Method for Multi-document Summarization[J].Journal of the China Society for Scientific andTechnical Information,2011,28(3).
Authors:Zhang Xianfei  Liu Song  Han Yongfeng  Sun Xianzhu
Institution:Zhang Xianfei~1,Liu Song~1,Han Yongfeng~1 and Sun Xianzhu~2 (1.Information Engineering Institute,Information Engineering University of PLA,Zhengzhou 450002,2.72495 Unit,Zhengzhou 450002)
Abstract:Multi-document summarization method based on multi-feature reduces dimension by manual means when selecting feature words,which is very mechanical.Meanwhile,there is imponderable problem for sparseness matrix when backdating word-document matrix for calculating similarity.This paper researches on multi-document summarization of topic tracking,and presents an efficient semantic-space dimension reduction method for multi-document summarization.The new method constructs semantic-space word-document matrix in t...
Keywords:semantic-space  multi-document summarization  feature dimension reduction  singular value decompose  clustering  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号