领域无关学术文献词汇功能标准化数据集构建及分析 |
| |
引用本文: | 程齐凯,李 信,陆 伟.领域无关学术文献词汇功能标准化数据集构建及分析[J].情报科学,2019,37(7):41-47. |
| |
作者姓名: | 程齐凯 李 信 陆 伟 |
| |
摘 要: | 【目的/意义】构建一个较大规模的学术文献词汇功能标准化数据集,并对其进行描述分析,以期为学术检 索、文献推荐和科学计量等应用研究提供更加科学合理的数据支撑。【方法/过程】在学术文本词汇功能框架的基础 上,针对“研究问题”和“研究方法”这两种领域无关词汇功能,生成学术文献词汇功能自动标引规则模板,开发相应 的词汇功能标注平台,对88 865篇计算机领域文献进行自动标引,并对得到的数据集进行整体分析、热点和趋势分 析以及研究方法特点分析。【结果/结论】得到一个包含23 221个不重复研究问题的Topic数据集、18427个不重复研 究方法的Method数据集和30 145个“问题-方法”对的Topic-Method数据集;人工检验准确率高于95%。此外,文 章还创新性地提出了研究方法的 “功能特点”,并进行了相关实践。
|
|
| 点击此处可从《情报科学》浏览原始摘要信息 |
| 点击此处可从《情报科学》下载免费的PDF全文 |
|