基于频繁语义模式的主题标注——以肿瘤靶向治疗技术为例 |
| |
引用本文: | 于慧娴,沈漫竹,梁曦,赵迎迎,袁红梅.基于频繁语义模式的主题标注——以肿瘤靶向治疗技术为例[J].情报理论与实践,2022(7):196-201. |
| |
作者姓名: | 于慧娴 沈漫竹 梁曦 赵迎迎 袁红梅 |
| |
作者单位: | 沈阳药科大学 |
| |
摘 要: | 目的/意义]为提高主题建模结果的可读性,解决主题标注过程中主观性强、可解释性弱的问题,引入本体和关联规则构建频繁语义模式。方法/过程]以肿瘤靶向治疗专利数据为研究对象,首先构建LDA2vec模型挖掘主题;然后考虑主题词的语义与共现,将UMLS本体与FP-growth关联规则相结合,得到频繁语义模式的主题标注;最后将结果与Canopy方法对比评估。结果/结论]实证结果显示,基于频繁语义模式的标注能够从统计和语义的角度概括主题含义,在主题标注工作中效果更佳。
|
关 键 词: | 主题标注 频繁语义模式 本体 关联规则 |
|
|