首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
随着互联网医疗的快速发展,数字经济和智能经济成为未来必然发展趋势,医学知识的语义化和规范化是实现智慧医疗和数字医学的重要手段。但现阶段较为成熟的医学本体仅仅描述了一些既定的静态知识,无法揭示医学知识之间的动态关联。因此,以知识表示和知识组织为出发点,构建符合叙事性文本特征的医学知识结构化表示方法具有十分重要的意义。本文在梳理叙事学理论、事件知识表示的基础上,按照是否具有叙事性特征,将医学文本分为叙事性文本和概念性文本;然后,分别对概念性医学文本和叙事性医学文本进行语义建模与表示,构建基于事件本体的医学知识本体模型;最后,根据本文提出的概念模型,实现SARS-CoV-2病毒入侵过程的语义结构化表示。初步标注的实验结果表明,将事件本体模型迁移到医学文本语义结构化描述中,有助于实现医学文本的深层次表示和知识发现,能更好地描述医学知识之间的动态关联,更好地表征医学对象在时间和空间的动态发展特点。  相似文献   

2.
古代经典辞书是重要的馆藏文献文化遗产,对其进行知识组织可实现古汉语词汇的语义关联和知识发现。文章深入分析了古代辞书的体例和内容结构,依据词汇语义学、本体术语学与资源描述框架标准,设计辞书知识本体,提出以词汇符号—概念—释义的结构化知识表示为基础的辞书知识图谱构建框架,依此进行词汇概念、关系、释义、例证的抽取,并完成关联数据的转换、存储与发布。最后以经典辞书《尔雅》为例,阐述了古代辞书知识图谱的构建过程以及在语义搜索、智慧学习、数字人文等场景中的应用。辞书知识图谱构建可以促进典籍辞书的数字人文研究。  相似文献   

3.
语义出版物是科学交流和学术出版领域一种新兴的数字出版物模型,适应了机器读取和理解文献内容的需要.本文以科学交流理论、文本功能理论和修辞结构理论为基础,在系统论视角下重点关注语义出版物内容组织架构中两个核心基本要素:组件单元和语义关系,并以语义出版物发展过程中的两个关键模型——纳米出版物模型和微型出版物模型为例,从模型架构、核心组件、语义关系、论证模式四个角度对语义出版物的内容组织架构进行探索性分析.研究表明,微型出版物模型具有明显的模块化、结构化、形式化和网络化特点,但在知识表示能力和内容组织架构上仍存在不足.揭示和形式化表示叙事性论文中的潜在知识是语义出版物内容组织架构设计面临的挑战.  相似文献   

4.
注疏是对古代典籍注释及再注释而形成的文本,不仅反映注疏者对古籍文本的认知理解,也是后人理解、传承与传播思想与文化的重要基础。利用本体和纳米出版物等语义技术对注疏文本进行知识表示和语义化建模,可以揭示注疏文献中蕴含的知识间的语义关系,并实现注疏文献的语义化出版与再造。为验证注疏知识表示和语义化建模方法的可行性及实用性,本文设计了包含引用关系的阐释本体,并以部分注疏文本为语料,实现了以纳米出版物为独立出版单位的注疏语义化表示与引用关系推断。实验证明,阐释本体可作为单语篇注疏知识单元结构化和跨语篇注疏知识单元关联化的数据模型,助力注疏文献的数据化处理与价值增值。注疏知识的语义化表示路径可以为古籍知识库建设、语义出版和数字化再造提供参考。图6。表5。参考文献41。  相似文献   

5.
陈涛  张靖 《图书馆杂志》2022,(3):118-125
本体是描述一个领域的术语集合,已广泛应用于数字人文研究中。然而,可获取、可利用的公开本体却少之又少,严重影响着数字人文资源之间的共享与交互。论文旨在通过构建本体服务中心,为数字人文研究提供在线的本体检索、交互和复用的知识平台。论文首先从数据存储出发,阐述了本体数据存储结构的设计思路和技术实施方案。其次,从本体的序列化转换、可视化呈现和接口化调用三部分探讨了本体的深层次应用。最后,论文详述了本体服务中心在数字人文本体发布和图像资源语义标注两类需求中的应用前景。当然,本体服务中心需要更多学者的共同参与和维护,只有将本体发布出来、利用起来,才能共建良好的本体应用生态。  相似文献   

6.
数字人文的兴起为红色文献的保护和传承提供了新的技术与方法。文章引入知识本体与知识图谱,对皖西红色文献进行细粒度关联,进而加快皖西红色文献数字化开发进程,为实现皖西红色文献资源的知识关联、聚合、发现提供新路径。以“书目框架模型”(BIBFRAME)为核心,构建知识本体的核心词表,从“文献”和“内容”两个层次设计实体的语义关联;依据知识本体的结构,抽取皖西红色文献中的实体及其关联,构建红色文献数据库,并自定义检索任务来模拟真实的检索需求;以“六霍起义”、革命英雄“舒传贤”和“红色事件地点分布”为主题,构建知识图谱并基于图谱进行知识发现。结果表明,知识本体可以有效提取皖西红色文献的实体数据并联结知识图谱以协助研究者进行文献检索与知识发现,佐证了以知识本体为代表的数字人文技术方法在红色文献研究中的使用价值与应用价值。  相似文献   

7.
数字人文概念的提出扩展了古文自动化处理的内涵与外延,实现古籍文本语义的深层理解成为首要任务。因此,本文重点探索古籍句读识别任务中的语义增强模式,以提升主流BBiC模型(BERT-BiLSTM-CRF)表征古籍文本语义的能力。本文融合结构特性从文本与模型两个维度实现古籍文本语义的深层表征,提出引入细粒度文本知识的BBiC-EK (BBiC-external knowledge)模型与融合文本结构特征的BBiCC-EK模型(BBiC-CNN-EK),并从模型结构化角度探究CNN与BiLSTM的最优连接方式以及外部知识编码的最优引入位置,多方位探究模型提升效果。研究结果表明,采用BBiC-EK模型中的最优外部知识组合模式,相较于基线BBiC模型能将句读识别准确率提升0.83个百分点;进一步融合CNN并探究最优模型结构下的BBiCC-EK (Se)模型能将BBiC模型的识别准确率提升1.36个百分点。本文通过融合结构特性的语义增强技术,实现了古籍文本句读识别准确率的提升,为古籍文本的自动化语义理解提供了新思路。  相似文献   

8.
本文通过对国内外知识图谱标准化研究和发布情况的系统梳理与剖析,发现当前知识图谱标准化过程中缺乏对底层语义关系结构和表示的标准化。因此,本文首先在MDR (metadata registries)概念元模型的基础上,扩充了语义关系类型和关系表示,构建了一个标准的、可扩展的、通用的知识图谱语义关系元模型,为知识图谱中语义关系的构建提供了必备的语义要素,实现从传统数据语义结构向知识图谱语义结构的迁移。其次,为实现语义关系表示的标准化,以该标准化元模型为指导,构建知识图谱语义关系标准化本体栈,为知识图谱语义关系标准化提供了从语义关系结构到表示的标准构建体系。最后,以石油领域井下作业业务需求为背景,对其中涉及的语义关系进行注册,并据此实现了石油领域井下作业知识图谱中语义关系的标准化,验证了本文提出的知识图谱语义关系元模型的合理性和正确性,提出的知识图谱语义关系元模型具有创新性。  相似文献   

9.
叙事型图像语义标注模型研究   总被引:4,自引:2,他引:2  
由于叙事型图像对时空语义信息表达的特殊性,目前叙事相关的语义模型并不适合直接用于该类型图像的语义标注。针对这一问题,本文设计了一个适用于叙事型图像的深度语义标注本体模型。该模型借助模块化本体设计思想,结合开放标注协同框架(OAC),以情节、实体、活动、情境为核心,解决了叙事型图像时空信息组织表达以及叙事模型和标注信息映射的问题。使用嵌入该标注模型的图像语义标注工具,对敦煌壁画进行语义标注实验,验证了该模型的可靠性和可用性。但是叙事型图像中情节的划分存在不同的见解,给情节提取和标注带来了不确定性,这是图像深度语义标注面临的挑战。图8。表1。参考文献22。  相似文献   

10.
[目的 /意义]设计面向高校图书馆思政信息服务需求、体现思政类编年史文献结构与修辞特征的语义模型及知识图谱应用。包括以历史文献为主线,通过数字人文建设,响应二十大提出抓好思政历史教育,引导知史爱党,知史爱国的指导方针。[方法 /过程]以《中华人民共和国学校德育编年史》为资源建设主线,针对其结构内容特征,面向高校图书馆思政信息服务不同用户需求,基于语义出版、事件本体以及知识图谱技术,构建思政编年史本体,并设计部署信息服务平台向高校广大师生推广应用。[结果 /结论 ]实现图书馆对高校思政教育信息服务支撑,建设高校图书馆思政信息资源元数据标准,并为以历史文献为主线的信息资源建设路线提供参考。  相似文献   

11.
[目的/意义]技术创新服务平台的建设中需要智能搜索引擎技术,智能搜索引擎技术的内涵或者说重点在于自动语义标注.技术创新服务平台上对搜索引擎的要求,与大众的搜索引擎的需求还是不同的,处理的对象主要是专业领域的文本,通过语义标注技术,能快速对企业文档进行语义化和结构化组织,从而为企业提供精准的知识服务.[方法/过程]针对专业领域语义标注的相关问题,在进行深入研究与探讨的基础上,将语义标注理解为是对一组文档资源进行组织语义化的过程,提出利用结构化语义概念资源或集合对数字化文本进行自动标引的方法,并根据概念实体出现频次、位置和关系等因素,自动抽取相关语义概念集合,实现相关文本的语义内容的自动标注.[结果/结论]评价语义标注相关实验的效果,展示语义标注的具体应用场景.同时,体现领域本体与语义标注语料不断更新、进化、形成互动的过程,旨在为专业领域的语义自动标注及智能搜索引擎的构建提供有益的参考.  相似文献   

12.
以清晰表达知识内涵、促进本体语义共享为目的,以医学文献知识为研究案例,文章基于UMLS语义网络顶级本体语义关系构筑了领域本体属性关系,并通过医学文献知识本体的构建,阐述了依托顶级本体的语义关系构筑领域本体语义的方法,探讨了基于顶级本体语义的领域本体通用构建途径,实现了医学文献本体的语义关系系统化,为领域本体的建模提供了思路。  相似文献   

13.
为了有效处理文本中的复杂语义问题,提出了一种基于领域本体的SOM文本逐层聚类方法.该方法基于领域本体的概念及其逻辑语义关系,将文本向量的表示从词的层面上升到主题概念层面,大大消减了文本向量的维数,提高了聚类效率.基于领域本体的概念层次关系,采用SOM算法实现文本的逐层聚类,以分层方式组织文档,方便用户由粗到精、由总体到局部地查阅文本集.通过无人机领域的Web文本聚类实验,验证了该方法的有效性.  相似文献   

14.
自然语言语义分析研究进展   总被引:5,自引:0,他引:5  
按照自然语言的构成层次——词语、句子和篇章,分析各层次语义分析的内涵、现有的研究策略、理论依据及存在的主要方法,并对现存的两类主要研究策略进行对比分析.认为词语语义分析是指确定词语意义,衡量两个词之间的语义相似度或相关度;句子语义分析研究包含句义分析和句义相似度分析两方面;文本语义分析就是识别文本的意义、主题、类别等语义信息的过程.当前的自然语言语义分析主要存在两种主要的研究策略:基于知识或语义学规则的语义分析和基于统计学的语义分析.基于统计与规则相融合的语义分析方法是未来自然语言语义分析的主流方法,本体语义学是自然语言语义分析的重要基础.  相似文献   

15.
[目的/意义]为更好地提升科技文献的语义丰富化效果,对国内外科技文献语篇元素标注模型、技术和方法进行调研总结,为文本挖掘、科技论文知识抽取、语义分析系统研究者提供借鉴。[方法/过程]利用学术网站搜索和相关数据库搜索引擎,对涉及科技论文标注、语篇元素、知识抽取、句子识别和自动文章分类等参考文献以及研究报告进行深入阅读和调研,对语篇元素自动标注模型以及相关工作进展进行研究总结。[结果/结论]科技文献语篇元素标注具有非常重要的实际应用价值,构建标注模型需充分考虑构建思想、标注领域和标注粒度以及标注技术手段等方面。  相似文献   

16.
针对本体获取的现状提出一种基于语言分析技术的本体自动获取方法,即利用词汇功能语法(LFG)这种先进的语法学理论对句子进行分析,使句子从语法表达转换到语义表达,进而获取句子的知识表示,从而可容易地从知识表示中获取本体。  相似文献   

17.
李芳  纪姗姗  周毅  刘峥 《图书情报工作》2017,61(24):123-134
[目的/意义]构建一个良好的本体可为语义出版提供机器可读的数据架构,支持出版物内容的结构化组织和语义化描述,支持出版工作流的术语规范控制,实现网络范围的增值效应。前瞻性思考其合理构成可为我国语义出版本体的构建实践提供参考。[方法/过程]选取国际学术出版领域分别具有理论和实践代表意义的SPAR本体和Nature本体,深入阐述其构建原则、逻辑结构和内容构成特点,并从多维度进行对比分析,梳理其优势与不足。[结果/结论]SPAR本体类目全面、属性丰富,突出语义内容的描述。Nature本体结构简洁,灵活实用,注重与外部资源的关联和映射。基于系统分析,认为语义出版本体的构成主要包括出版物和出版工作两方面信息。其中,对出版物重要构成要素(如参考文献与引用信息、学术贡献等)进行深入的建模描述,可增强本体表示能力,更好地支持语义出版的实现;同时,注意做好顶层设计,以实现本体模型的结构简洁与功能高效。  相似文献   

18.
Semantic Web与基于语义的网络信息检索   总被引:54,自引:3,他引:51  
张晓林 《情报学报》2002,21(4):413-420
本文描述网络环境语义检索的需求 ,分析SemanticWeb的组成框架 ,探讨概念集 (ontologies)及其定义和标记语言 ,并介绍基于概念集的信息资源语义标注和语义推理基本过程。  相似文献   

19.
近年来国际学术界在本体对应研究方面呈现三个主要特征:一是投入了更多关注,使相关研究日臻成熟;二是在开放语义网络环境下,研究人员更青睐于多本体的匹配与对应,并且本体对应已成为学术界构建适于分布式网络结构的多本体协同系统的主要手段;三是越来越多的研究成果已经从基础理论研究转向了针对具体问题的实证研究。但开放性、分布式的语义Web环境对现有不同本体间的协调应用提出了挑战。通过对2000年以来国际学术界关于本体协调相关文献和研究成果的梳理,阐明了以本体映射为核心的本体协调各要素之间的关系,并对本体合并、本体集成与本体对应三条本体协调主要发展路径的前沿热点进行了分析,指出未来本体协调的相关研究将继续沿着"本体构建→本体合并→本体集成→本体对应"这一总体路径向前发展。  相似文献   

20.
基于图挖掘的文本主题识别方法研究综述   总被引:1,自引:1,他引:0  
本文通过文献调研分析,将基于图挖掘的文本主题识别方法总结为中心度方法、紧密关联子图查找和图聚类三种,后两者又细分为基于clique子团或类clique子团、基于图拓扑结构或结点属性聚类的方法。中心度方法通过对比文本网络中术语结点的重要度来实现文本主题的识别,紧密关联子图查找和图聚类方法则是根据文本图中术语结点和边的属性相似度来识别文本核心主题。基于语言文本网络自身特性,如何构建复杂文本关系图来同时揭示术语间的句法、共现和语义关系,如何基于术语关联和图拓扑结构识别其中的紧密关联子团,基于何种标准将紧密关联子团聚类以揭示文本核心主题,都是未来需要进一步深入研究的问题。表1。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号