首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于关键词对逆文档频率的主题新颖度度量方法
引用本文:杨建林,钱玲飞.基于关键词对逆文档频率的主题新颖度度量方法[J].情报理论与实践,2013,36(3):99-102.
作者姓名:杨建林  钱玲飞
作者单位:1. 南京大学 信息管理学院,江苏 南京,210093
2. 南京大学 信息管理学院,江苏 南京210093;南京航空航天大学 图书馆,江苏 南京 210016
基金项目:国家社会科学基金项目(项目编号:09BTQ020);江苏高校哲学社会科学研究重点项目(项目编号:2011ZDIXM035)资助
摘    要:文章吸收词频原则、逆文档频率原则以及共词分析的思想,提出解决文档主题新颖度量化问题的4个原则,在此基础上定义带时间戳关键词逆文档频率、带时间戳关键词对逆文档频率、文档新颖度等3个概念,给出文档新颖度的计算公式,并对该公式的实用性与合理性进行实证研究.实验结果表明:文中提出的文档主题新颖度量化方法是科学的、合理的、可操作的,但是,不规范的标引词标引、关键词个数过少等现象对主题新颖度计量结果的准确性影响较大.

关 键 词:文档主题新颖度  关键词  度量方法

Theme Novelty Measurement Based on Inverse Document Frequency of Keyword Pairs
Institution:Yang Jianlin et al
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号