首页 | 本学科首页   官方微博 | 高级检索  
     检索      

命名实体识别技术在“数字敦煌”中的应用研究北大核心CSSCISSCI
引用本文:巩一璞,王小伟,王济民,王顺仁.命名实体识别技术在“数字敦煌”中的应用研究北大核心CSSCISSCI[J].家教指南,2022(2):149-158.
作者姓名:巩一璞  王小伟  王济民  王顺仁
作者单位:敦煌研究院,甘肃 敦煌 736200;国家古代壁画与土遗址保护工程技术研究中心,甘肃 敦煌 736200;古代壁画保护国家文物局重点科研基地,甘肃 敦煌 736200;甘肃省敦煌文物保护研究中心,甘肃 敦煌 736200,洛桑联邦理工学院,瑞士 洛桑 CH-1015
基金项目:甘肃省重点人才项目;甘肃省文物保护科学和技术研究课题;敦煌研究院院级科研课题
摘    要:命名实体识别是自然语言处理基础任务之一。针对“数字敦煌”项目应用命名实体识别技术存在的实体边界难以确定等问题,通过构建小规模敦煌石窟专有名词数据集,对基于BERT-BiLSTM-CRF的命名实体识别基本方法,和基于Multi-digraph的词汇增强方法进行了实验对比,结果表明基本方法已具备较高的识别准确率,而基于词汇增强的方法对未登录词识别效果提升显著。最后将训练得到的模型应用于“数字敦煌”资源库命名实体识别任务,证明了方法的有效性。

关 键 词:命名实体识别  BERT  LSTM  词汇增强  数字敦煌

Practical Research of NER Technology in the "Digital Dunhuang"Project
Authors:GONG Yipu  WANG Xiaowei  WANG Jimin  WANG Shunren
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号