首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
文本自动分词是非物质文化遗产相关数字人文研究的基础与关键步骤,是深度发掘非遗内在信息的前提。文章构建了国家级非物质文化遗产项目申报文本自动分词模型,探究了融入领域知识的机器学习模型CRF、深度学习模型Bi-LSTM-CRF和预训练语言模型BERT、RoBERTa、ALBERT在非遗文本上的分词性能,并对比了通用分词工具HanLP、Jieba、NLPIR的效果。在全部14种模型中,RoBERTa模型效果最佳,F值达到了97.28%,预训练模型中ALBERT在同等条件下训练速度最快。调用分词模型,构建了非遗文本领域词表和全文分词语料库,对非遗文本词汇分布情况进行了分析挖掘。开发了中国非物质文化遗产文本自动分词系统(CITS),为非遗文本自动分词及分词结果的多维可视化分析提供了工具。  相似文献   

2.
专利术语抽取是专利文献信息抽取领域的一项重要任务,有助于专利领域词表的构建,有利于中文分词、句法分析、语法分析等工作的进行。文章通过分析专利术语的特点并制定相应的语料标注规则进行人工标注,采用条件随机场(conditional random fields,CRFs)对标注后的数据进行训练和测试,实现了通信领域的术语抽取。标注方法采用基于字的序列标注,精确率、召回率和F值分别达到80.9%、75.6%、78.2%,优于将词和词性等信息作为特征的方法,表明所提出的专利术语抽取方法是有效的。  相似文献   

3.
基于BERT嵌入BiLSTM-CRF模型的中文专业术语抽取研究   总被引:2,自引:0,他引:2  
专业术语的识别与自动抽取对于提升专业信息检索精度,构建领域知识图谱发挥着重要基础性作用。为进一步提升中文专业术语识别的精确率和召回率,提出一种端到端的不依赖人工特征选择和领域知识,基于谷歌BERT预训练语言模型及中文预训练字嵌入向量,融合BiLSTM和CRF的中文专业术语抽取模型。以自建的1278条深度学习语料数据为实验对象,该模型对术语提取的F1值为92.96%,相对于传统的浅层机器学习模型(如左右熵与互信息算法、word2vec相似词算法等)和BiLSTM-CRF深度神经网络模型的性能有较为显著的提升。本文也给出了模型应用的具体流程,能够为中文专业术语库的构建提供实践指南。  相似文献   

4.
在跨学科知识范式下,数字人文的研究范畴随着自身学科体系的拓展而不断泛化,采取关键语义技术解析文化对象中的人文内涵与情感知识对于重拾学科“人文性”与“计算性”特质具有重要意义。本文以古诗文本为例,面向汉语诗文及其鉴赏实现大规模人文情感术语的自动化抽取与分析。首先在无标注集环境下提出一种基于“冷启动”的字序列自动标引方法来获取学习语料,随后在字向量(Char2Vec)指导下将汉字特征(部首、拼音等)和BERT语言学模型分别引入机器学习与深度学习模型,并从知识发现的角度定义新术语识别规则。研究发现,将现代鉴赏融入古诗原文显著优化了情感知识的广度与深度,领域术语能够被有效标引。训练的BERT-BiLSTM-CRFs深度学习模型的效果明显优于CRFs机器学习,最佳F1与F1_distinct可分别达到9563%和8543%;同时汉字特征的引入也有效提升了传统CRFs效果,以领域特征和基于“竖心旁”“心字底”部首约束特征为最优。相较于机器学习抽取出的长篇幅新术语,深度学习能够拓展出更多寄托情感知识的新意象词。源于诗文与鉴赏的情感术语为文学信息资源的情感分析与知识服务提供了参考(人文性),基于汉字语言特征的抽取方案为中文领域自然语言处理技术的深化提供了启迪(计算性)。图11。表6。参考文献30。  相似文献   

5.
侯丽  李姣  侯震  陈松景 《图书情报工作》2015,59(23):115-123
[目的/意义] 从互联网公众查询数据中发现公众使用的健康术语,为建立公众健康术语与医学专业术语的映射提供基础,进而优化健康类知识服务平台的知识组织与管理性能。[方法/过程] 设计规则与N-Gram相结合的健康术语新词的识别模型,采集公众查询数据,开展实验验证,通过多次实验,逐步完善过滤语料集合,结合人工判读,不断优化并验证方案的有效性。[结果/结论] 从互联网中公众提问句抽取出规则,结合统计算法进行公众使用的健康类新词抽取,该技术方法对识别公众使用的健康术语具有一定的通用性,能为建立公众术语与医学术语映射提供数据基础。实验结果表明:基于规则进行公众日志数据预处理,能为后续的实验方案提供较好的预处理文本,而采用N-Gram及各种过滤规则结合的术语识别方法,能较好地识别发现短文本中的新词。  相似文献   

6.
戴雨悠 《声屏世界》2016,(11):34-36
2011年6月,我国第一部《非物质文化遗产保护法》正式实施,这是我国文化遗产保护史上和文化建设史上的里程碑。为积极配合国家倡导的非物质文化遗产保护,江苏省文化厅分批次下达文书让江苏各地积极申报非遗项目。2014年,大型非遗专题片《非遗江苏》项目正式启动,2015年春节期间在江苏国际频道播出。一经播出,便获得关注。本文试图对《非遗江苏》进行解构,对以非物质文化遗产为主题的电视节目表现手法作进一步探索。  相似文献   

7.
研究从科技论文文本中抽取作者关键词以外的科技术语的方法。因为标引效应问题,单纯选择论文中的关键词作为候选术语会影响术语库的数量和质量,需要考虑从论文文本中抽取术语。现有的大多数术语抽取方法重视采用termhood指标,而忽视unithood指标,针对此问题,在C-value算法的基础上,提出用于生成候选术语的中文术语构词规则和测量术语内部结合强度的unithood指标,实现从论文文本中抽取中文科技术语。以信息资源管理领域的术语抽取为例对提出的方法进行验证,实验结果证明,提出的方法能够有效地抽取领域科技术语,抽取精度较高。  相似文献   

8.
熊拥军  陈湘  彭维 《图书馆》2016,(2):33-37
文章在对非物质文化遗产(以下简称"非遗")相关资源常用元数据标准调研的基础上,研究各元数据标准的元素特点。采用对象关系模型的分析方法,对非遗资源进行分析,并对非遗相关资源的八种元数据标准进行介绍、比较和分析。结果表明:非遗相关资源涉及到项目、人物、机构、物质资源和非物质资源五类资源对象,各类资源对象常用元数据标准在结构特点、功能需求、元素组成、核心元数据和编码等方面表现各异。  相似文献   

9.
非物质文化遗产APP已成为政府部门、出版社、文化机构保护和传承非物质文化遗产的创新途径.非遗APP想要拥有更大的用户规模、更强的用户黏性,应解决非遗APP的痛点.文章从UCD视角切入,解决非遗APP设计与使用中用户关注的问题,增强非遗APP的市场生存能力,以数字化的传承方式进一步提升非物质文化遗产的影响力.  相似文献   

10.
<正>非物质文化遗产(以下简称“非遗”)是中华优秀传统文化的重要组成部分,保护好、传承好、利用好非遗资源,对于坚定文化自信、建设社会主义文化强国具有重要意义。然而,非遗的无形性、活态性、分散性等特点决定了保护与传承的难度较大。为此,可以借助档案管理理论与方法,通过拍照、录音、录像等记录方法,将活态的非遗固化至一定的载体,形成非遗信息资源,进而通过整理、保管等措施为日后提供利用,即非遗档案式保护[1]。2011年2月颁布的《中华人民共和国非物质文化遗产法》强调:“国家对非物质文化遗产采取认定、  相似文献   

11.
针对中国特色的非物质文化遗产保护实践与经验,2019年6月中华人民共和国文化和旅游部、广东省人民政府主办,中山大学承办的"非物质文化遗产保护的中国实践"论坛在广州举行。200多名来自不同地区的专家学者,从实践经验总结、非遗现代化转化和个案分析三个方面对新时代背景下的中国非物质文化遗产保护实践的新机遇和新使命进行了探讨,展示了非遗保护的"中国经验",发出了"中国声音"。  相似文献   

12.
非物质文化遗产文献,是指与非物质文化遗产项目有关的记载资料,它是一种特殊的地方文献。目前,图书馆、文化馆、博物馆、档案馆等公共文化机构,已经开始着手进行非物质文化遗产文献的收集、整理、研究、学术交流等活动。全国古籍保护工作专家委员会委员、国家图书馆研究馆员李致忠指出,非遗和典籍文献之间的关系非常紧密,很多非物质文化遗产一方面要活态传  相似文献   

13.
互联网大数据挖掘与非遗活化研究   总被引:1,自引:0,他引:1  
在WEB2.0时代,互联网上的数据呈现出动态变化的特点,时刻部有新的数据出现.除新闻数据外,如论坛、博客等数据都随时间和空间的扩展,共同构成了互联网大规模数据,简称大数据.对非物质文化遗产而言,在非遗信息流传过程中因不断吸收新的因素、通过扬弃而蜕变、更新,从而获得生存和继续传袭下去的活力.本文拟通过对入选非物质文化遗产名录的部分非遗项目进行媒体活跃度分析,对互联网大规模数据中的非物质文化遗产的关注度和成因进行分析,进而提出对应策略,为非物质文化遗产的活化在传播学领域找出方法和路径.  相似文献   

14.
非物质文化遗产是珍贵的民族文化资源,传承与保护非物质文化遗产不仅仅是地方政府的职责,也是地方高校,尤其是高校图书馆的重要使命。在介绍天津非物质文化遗产项目以及传承人概况的基础上,分析了天津市非物质文化遗产宣传保护现状,提出了高校图书馆参与非遗传承保护的实现途径:地方高校图书馆应在做好地方非遗文化调研的基础上,结合本馆资源、人员等特点,加强与地方各部门的合作,丰富宣传手段,设立文化推广部、建立非遗平台,提高大学生非遗传承与保护的意识,激发他们热爱中华优秀传统文化的热情。  相似文献   

15.
非物质文化遗产(以下简称“非遗”)档案是否设置全宗、怎样设置全宗等问题,将随着“非遗”档案管理工作的发展日益凸现出来。本文就此发表一点个人看法,请教档案界同仁。  相似文献   

16.
王亮 《编辑之友》2015,(6):47-50
非物质文化遗产是国家的宝贵资源,对非遗的研究涉及众多领域.文章从媒介视域视角对非物质文化遗产进行研究,探讨其作为媒介的合法性,并分析其媒介形态和传播类型,从而在媒介环境下,树立非遗的科学传承保护观,推进国家软实力建设.  相似文献   

17.
如何运用知识组织理论对术语资源进行有效的组织、管理和利用,为用户提供准确、便捷、丰富的术语服务,是图书情报领域开展知识服务的重要研究课题之一。知识组织以术语为基本单元、将各类知识进行紧密组织、形成有机统一的知识集,产生了叙词表、分类表、本体、术语库等各类知识组织工具。知识组织与术语具有天然紧密的联系,知识组织理论、方法与技术,为术语服务提供了有益的借鉴,而术语服务的研究与开展,将会推动知识组织系统的应用和完善。  相似文献   

18.
非物质文化遗产领域蕴含着丰富的知识,是中华传统文化的重要组成部分,对非遗知识的有效组织与管理,是非遗文化保护、传播与传承的前提和基础。本体与关联数据技术为非遗知识的组织与管理提供了新的方法和实现路径。本文首先分析梳理了非遗领域知识的要素与语义关系,设计构建了非遗知识本体模型,以规范和揭示非遗领域知识的概念、属性和关联关系;其次,基于关联数据技术,研究非遗知识组织与关联数据集构建的过程,包括实体RDF化、实体关联、关联数据存储与发布等关键步骤;最后以湖北省非遗项目为例,构建了非遗知识关联数据集与知识服务平台。关联数据技术在非遗知识组织与管理领域的应用,能够促进非遗知识管理的规范化和标准化,对我国非遗文化的保护与传承具有重要的意义。图13。表4。参考文献25。  相似文献   

19.
术语的抽取是领域本体构建的基础工作,决定了本体构建的质量.获取的术语除了要求有准确的短语识别率,还要求有较高的术语领域度.本文试图研究一种不依赖于背景语料的术语领域度筛选方法.本文的主要工作集中在两个方面:一是通过统计和规则相结合的方法从领域语料中抽取候选术语(短语),二是提出了通过候选术语的分布度、活跃度以及主题度进行计算的多策略术语抽取方法,并通过实验进行了验证和分析.实验结果表明,在小规模航空航天领域语料库上进行验证性实验后发现,在不大量增加计算时间复杂度的情况下,能够有效提高领域术语抽取的质量,获得令人较满意的结果.  相似文献   

20.
冯丽  戴旸 《北京档案》2015,(5):23-26
非物质文化遗产(以下简称“非遗”)建档是非遗保护与传承的重要形式之一。我国的非遗建档保护起步较晚,虽取得了一些成就,但也存在一定的问题。本文探讨了Web2.0技术对我国非遗建档保护的促进,在总结Web2.0技术引入非遗建档必要性与可行性的基础上,从收集、分类、鉴定和宣传四个环节进行详细阐述。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号