基于信息增益与相似度的专利关键词抽取算法评价模型 |
| |
引用本文: | 俞琰,鞠鹏,尚明杰.基于信息增益与相似度的专利关键词抽取算法评价模型[J].图书情报工作,2022(6):108-117. |
| |
作者姓名: | 俞琰 鞠鹏 尚明杰 |
| |
作者单位: | 1. 南京工业大学信息管理与技术研究所;2. 东南大学成贤学院计算机工程系 |
| |
基金项目: | 国家社会科学基金项目“大数据时代支持创新设计的多维度多层次专利文本挖掘研究”(项目编号:17BTQ059)研究成果之一; |
| |
摘 要: | 目的/意义]针对目前专利关键词抽取算法评价中主要采用抽取的关键词与专家人工标注关键词进行匹配存在的问题,提出一种基于信息增益与相似度的专利关键词抽取算法评价模型。方法/过程]提出的评价模型从内部和外部两个层面评估专利关键词抽取算法的准确性。其中,内部评价模型度量待评价算法抽取的每个关键词的信息增益,以评估被抽取的关键词的新颖性与创造性;外部评价模型使用待评价算法抽取的关键词集表示专利,计算相关专利的相似度,衡量算法抽取的关键词描述专利主题的有效性。结果/结论]通过评价模型有效性验证实验与评价模型应用实证研究,结果表明提出的基于信息增益与相似度的评价模型具有可行性与有效性。
|
关 键 词: | 专利 关键词抽取 评价 信息增益 相似度 |
|
|