基于关键词对逆文档频率的主题新颖度度量方法 |
| |
引用本文: | 杨建林,钱玲飞.基于关键词对逆文档频率的主题新颖度度量方法[J].情报理论与实践,2013,36(3):99-102. |
| |
作者姓名: | 杨建林 钱玲飞 |
| |
作者单位: | 1. 南京大学 信息管理学院,江苏 南京,210093 2. 南京大学 信息管理学院,江苏 南京210093;南京航空航天大学 图书馆,江苏 南京 210016 |
| |
基金项目: | 国家社会科学基金项目(项目编号:09BTQ020);江苏高校哲学社会科学研究重点项目(项目编号:2011ZDIXM035)资助 |
| |
摘 要: | 文章吸收词频原则、逆文档频率原则以及共词分析的思想,提出解决文档主题新颖度量化问题的4个原则,在此基础上定义带时间戳关键词逆文档频率、带时间戳关键词对逆文档频率、文档新颖度等3个概念,给出文档新颖度的计算公式,并对该公式的实用性与合理性进行实证研究.实验结果表明:文中提出的文档主题新颖度量化方法是科学的、合理的、可操作的,但是,不规范的标引词标引、关键词个数过少等现象对主题新颖度计量结果的准确性影响较大.
|
关 键 词: | 文档主题新颖度 关键词 度量方法 |
Theme Novelty Measurement Based on Inverse Document Frequency of Keyword Pairs |
| |
Institution: | Yang Jianlin et al |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 CNKI 万方数据 等数据库收录! |
|