首页 | 本学科首页   官方微博 | 高级检索  
     检索      

融合学习扩展的非遗陶瓷工艺领域术语库构建及应用
引用本文:汪琳,王昊,李晓敏,邓三鸿.融合学习扩展的非遗陶瓷工艺领域术语库构建及应用[J].图书馆论坛,2024(2):66-78.
作者姓名:汪琳  王昊  李晓敏  邓三鸿
作者单位:1. 南京大学信息管理学院;2. 南京大学江苏省数据工程与知识服务重点实验室办公室
基金项目:国家自然科学基金项目“关联数据驱动下我国非遗文本的语义解析与人文计算研究”(项目编号:72074108);;中央高校基本科研业务费项目“面向人文计算的方志文本的语义分析和知识图谱研究”(项目编号:010814370113)研究成果;
摘    要:文章通过学习扩展的机器学习和深度学习,提出针对非物质文化遗产项目语料的术语抽取及新词发现方法,形成领域术语库并探讨在数字人文领域的应用。首先使用自然语言处理方法对非遗陶瓷语料进行预处理,结合领域术语词表对语料进行标注;然后针对Random-CRFs模型,研究词表特征(DICT)、词性特征(POS)、部首特征(Radical)、拼音特征(Pinyin)对术语抽取效果的影响,再对比Random-CRFs、Random-BiLSTM、Random-BiLSTM-CRFs、BERT-BiLSTMCRFs等4个模型对术语抽取效果的影响;最后使用训练完成的模型对测试集语料进行新词识别,对抽取出的候选词进行人工判断,构建包含1,173个术语的非物质文化遗产陶瓷工艺领域术语库,将其应用于非遗项目画像、非遗陶瓷工艺知识图谱和非遗陶瓷工艺术语检索。

关 键 词:非物质文化遗产  领域术语  新词发现  数字人文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号