首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于LSTM的生物医学核心实体提取模型研究
引用本文:唐颖,曹春萍.基于LSTM的生物医学核心实体提取模型研究[J].教育技术导刊,2018,17(5):132-137.
作者姓名:唐颖  曹春萍
作者单位:上海理工大学 光电信息与计算机工程学院,上海 200093
摘    要:识别一篇生物医学文献中的核心实体是准确提取该文献信息的前提。针对目前生物医学文献实体识别和筛选方法的局限性,提出了基于LSTM的生物医学核心实体提取模型。该模型以LSTM为核心,通过更为优秀的词向量和输入生成规则改良模型输入,使用双向LSTM模型改进处理过程,将结果保存为树形结构并对该树进行合理剪枝获取标注链,实现输出结果处理,最终使实体识别的F1值达到了89.35%。此外,在核心实体筛选过程中,基于TF/IDF算法规则,充分考虑了词频、位置、逆文档频率等因素,使核心实体筛选的F1值达到了76.85%。

关 键 词:实体识别  改进词向量  双向LSTM  剪枝策略  核心实体筛选  
点击此处可从《教育技术导刊》浏览原始摘要信息
点击此处可从《教育技术导刊》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号