首页 | 本学科首页   官方微博 | 高级检索  
     检索      

适用于隐含主题抽取的K最近邻关键词自动抽取
引用本文:张庆国,章成志,薛德军,张君玉.适用于隐含主题抽取的K最近邻关键词自动抽取[J].情报学报,2009,28(2).
作者姓名:张庆国  章成志  薛德军  张君玉
作者单位:1. 同方知网(北京)技术有限公司,北京,100084
2. 南京理工大学经济管理学院信息管理系,南京,210094
3. 中国科学院研究生院,北京,100049
基金项目:国家科技支撑计划重点项目,南京理工大学科研启动基金 
摘    要:众所周知,K最近邻方法作为机器学习领域的一个经典的方法,在很多领域都有出色的表现.本文利用K最近邻方法的思想,提出了一种基于K最近邻的关键词自动抽取方法.现有的关键词抽取技术仅仅是对正文词汇的抽取,不能抽取隐含主题.隐含主题的抽取是关键词自动抽取技术的难点,但是该方法可以有效抽取隐含主题.该方法首先对数据进行预处理,使用向量空间模型将文本表述为数学化语言;然后,以人工标注关键词的文献数据作为训练集,使用K最近邻方法构建新文献的关键词候选集;最后,根据关键词本身的特点对候选关键词做了有效的后处理.实验表明,该方法不仅可以提高关键词抽取的准确率和召回率,还可以有效抽取文章的隐含主题.

关 键 词:自动抽取  K最近邻  隐含主题  向量空间模型

Automatic Keyword Extraction Based on KNN for Implicit Subject Extraction
Zhang Qingguo,Zhang Chengzhi,Xue Dejun,Zhang Junyu.Automatic Keyword Extraction Based on KNN for Implicit Subject Extraction[J].Journal of the China Society for Scientific andTechnical Information,2009,28(2).
Authors:Zhang Qingguo  Zhang Chengzhi  Xue Dejun  Zhang Junyu
Abstract:As we all know,KNN method is a classic method in machine learning field and is also well used in many other fields.In this paper,we proposed an automatic keyword extraction method based on KNN method.Automatic keyword extraction methods can only extract words appeared in articles.It is a difficult work to extract implicit subject in an article.However,the method we proposed can extract implicit subject efficiently.Firstly,it performed preprocessing that translated the text document to mathematical expressio...
Keywords:automatic keyword extraction  KNN  implicit subject  VSM  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号