命名实体识别技术在“数字敦煌”中的应用研究北大核心CSSCISSCI |
| |
引用本文: | 巩一璞,王小伟,王济民,王顺仁.命名实体识别技术在“数字敦煌”中的应用研究北大核心CSSCISSCI[J].家教指南,2022(2):149-158. |
| |
作者姓名: | 巩一璞 王小伟 王济民 王顺仁 |
| |
作者单位: | 敦煌研究院,甘肃 敦煌 736200;国家古代壁画与土遗址保护工程技术研究中心,甘肃 敦煌 736200;古代壁画保护国家文物局重点科研基地,甘肃 敦煌 736200;甘肃省敦煌文物保护研究中心,甘肃 敦煌 736200,洛桑联邦理工学院,瑞士 洛桑 CH-1015 |
| |
基金项目: | 甘肃省重点人才项目;甘肃省文物保护科学和技术研究课题;敦煌研究院院级科研课题 |
| |
摘 要: | 命名实体识别是自然语言处理基础任务之一。针对“数字敦煌”项目应用命名实体识别技术存在的实体边界难以确定等问题,通过构建小规模敦煌石窟专有名词数据集,对基于BERT-BiLSTM-CRF的命名实体识别基本方法,和基于Multi-digraph的词汇增强方法进行了实验对比,结果表明基本方法已具备较高的识别准确率,而基于词汇增强的方法对未登录词识别效果提升显著。最后将训练得到的模型应用于“数字敦煌”资源库命名实体识别任务,证明了方法的有效性。
|
关 键 词: | 命名实体识别 BERT LSTM 词汇增强 数字敦煌 |
Practical Research of NER Technology in the "Digital Dunhuang"Project |
| |
Authors: | GONG Yipu WANG Xiaowei WANG Jimin WANG Shunren |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 维普 万方数据 等数据库收录! |
|