基于LSTM的生物医学核心实体提取模型研究 |
| |
引用本文: | 唐颖,曹春萍.基于LSTM的生物医学核心实体提取模型研究[J].教育技术导刊,2018,17(5):132-137. |
| |
作者姓名: | 唐颖 曹春萍 |
| |
作者单位: | 上海理工大学 光电信息与计算机工程学院,上海 200093 |
| |
摘 要: | 识别一篇生物医学文献中的核心实体是准确提取该文献信息的前提。针对目前生物医学文献实体识别和筛选方法的局限性,提出了基于LSTM的生物医学核心实体提取模型。该模型以LSTM为核心,通过更为优秀的词向量和输入生成规则改良模型输入,使用双向LSTM模型改进处理过程,将结果保存为树形结构并对该树进行合理剪枝获取标注链,实现输出结果处理,最终使实体识别的F1值达到了89.35%。此外,在核心实体筛选过程中,基于TF/IDF算法规则,充分考虑了词频、位置、逆文档频率等因素,使核心实体筛选的F1值达到了76.85%。
|
关 键 词: | 实体识别 改进词向量 双向LSTM 剪枝策略 核心实体筛选 |
|
| 点击此处可从《教育技术导刊》浏览原始摘要信息 |
| 点击此处可从《教育技术导刊》下载免费的PDF全文 |
|