首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
[目的/意义]吐蕃时期的金石铭刻是了解吐蕃社会政治制度、宗教信仰、对外交往、社会关系、语言状况等的重要依据。本研究致力于构建吐蕃藏文金石铭刻知识图谱,探索民族古文献数字化新途径。[方法/过程]借助数字人文和知识图谱构建技术,通过本体建模分别构建吐蕃金石铭刻概况、研究现状、刻文内容和语法范畴4种本体,抽取概念、属性、关系,并以三元组方式表示;把刻文中的每一个词作为实例,构建实例之间异体、简缩、变形等链接关系以及命名实体之间的各种关联关系,以高度结构化的形式存储知识,形成吐蕃金石铭刻知识图谱。[结果/结论]吐蕃藏文金石铭刻知识图谱是藏文古文献数字人文研究的有益探索。以藏汉双语词级对齐形式呈现实例,使更多的研究者利用该材料开展研究,更好地挖掘吐蕃藏文金石铭刻的学术价值。  相似文献   

2.
[目的/意义] 梳理基于知识图谱的实体检索的研究脉络和重点,探索未来该领域的发展方向。[方法/过程] 概述基于知识图谱的实体检索的形式化定义、实现路径以及主要的数据源;根据检索任务,将实体检索划分为匹配检索、扩展检索和推荐检索3种实现场景,并对其实现方法进行综述。[结果/结论] 随着应用的不断深入,基于知识图谱的实体检索研究开始关注如何优化用户的检索体验和提供多样性的检索结果,未来将在检索结果可解释性、跨领域知识图谱检索等多个方面展开深入的研究。  相似文献   

3.
[目的/意义]挖掘和组织先秦典籍中的植物知识,构建先秦典籍植物知识图谱,对认识我国古代人民社会和生活状态等具有重要意义。[方法/过程]对先秦典籍中植物词进行详尽标注与计量分析;基于条件随机场(CRF)和多种深度学习模型构建古汉语植物命名实体识别模型,比较分析各模型性能以确定最优模型;设计面向知识图谱的古汉语植物知识组织模式。[结果/结论]基于古汉语预训练语言模型SikuRoBERTa构建的古汉语植物命名实体识别模型性能最优,调和平均值达85.44%,为基于实体的植物知识挖掘提供了有效方法;所构建的先秦典籍植物知识图谱可实现对先秦典籍中植物实体及其关联知识的聚合与可视化呈现。  相似文献   

4.
[目的/意义]提出一个药物不良反应本体的半自动构建方法,构建的细粒度药物不良反应本体为利用社交媒体挖掘潜在的药物不良反应信号提供语义资源库。[方法/过程]首先,采用业务层次和语言层次相分离的设计理念,将用户在社交媒体中评论的药物不良反应表示成"对象要素-属性要素-描述概念"的形式。细粒度体现在社交媒体用户对药物同一不良反应描述概念表达的多样性上。然后,基于深度学习的思想,利用基于word2vec的描述概念候选词抽取算法自动地抽取出更多的描述概念候选词构建本体。[结果/结论]以糖尿病药物的建模实例表明,提出的细粒度药物不良反应本体的半自动构建方案,提高了本体构建的智能化水平,构建的细粒度药物不良反应本体为利用社交媒体挖掘潜在的药物不良反应信号提供语义资源库。  相似文献   

5.
[目的/意义]通过对国内外多语本体领域映射技术相关研究成果的总结和EuroWordNet案例分析,为国内跨语言信息检索系统映射机制的建立提供借鉴和参考。[方法/过程]选取目前发展较为成熟的多语本体库EuroWordNet作为案例,分别从数据库设计、本体构建、概念存储和多语文化差异的映射处理4个方面对其中间语言索引机制(Inter-Lingual-Index,ILI)进行分析。[结果/结论]嵌入式的数据库结构设计、概念抽取及同义词集对应关系的界定、概念存储的细粒度化和复杂等价关系的建立是建立跨语言信息检索映射机制的关键。  相似文献   

6.
大规模中国历代存世典籍知识图谱构建研究   总被引:2,自引:1,他引:1  
[目的/意义]探索构建中国历代存世典籍知识图谱,以为研究者挖掘海量古籍书目数据背后隐藏的知识提供一站式平台,拓展古籍知识服务内涵,同时,大规模的典籍知识图谱也是机器智能的重要基础。[方法/过程]通过知识图谱技术对中国历代存世典籍进行知识组织,从需求层、模型层、应用层3部分构建一个典籍知识图谱框架模型,通过人机协作进行典籍数据抽取及多源数据融合,完成数据的整理,并对典籍知识图谱实体类型及属性、典籍知识图谱实体关系及类型进行分析与定义。[结果/结论]所构建的典籍知识图谱包含649549种古籍实体、221783位典籍责任者、1498383个古籍版本、13960个地名节点,形成了一个立体、多维、多用途的古籍知识关联网络,对全球目前存世的主要中国历代典籍书目信息进行了较全面描述。  相似文献   

7.
基于知识元的数字图书馆多粒度集成知识服务研究   总被引:1,自引:0,他引:1  
[目的/意义] 为满足用户多粒度的知识需求,提出一种数字图书馆多粒度集成知识服务模式。[方法/过程] 首先对知识元的类型与描述规则以及不同类型知识元的实体对象结构加以定义;然后根据知识元抽取、标引和链接的方法,提出基于显性、隐性知识链接的多粒度知识集合集成方法;最后通过规范化分解用户提交的知识需求,构建"需求——知识——资源"三级映射,实现数字图书馆多粒度的集成知识服务模式。[结果/结论] 该方法将知识服务的控制单位从粗粒度的文献单元,深入到以知识元、知识元集合为单位的细粒度知识单元中,为用户提供不同粒度的知识资源。  相似文献   

8.
[目的/意义] 在进行大规模知识库构建时,基于手工方式的构建模式效率较低并且可行性较差,因此,从网络百科中自动地获取海量知识已经被越来越多的学者所关注。目前的研究主要关注于从英文网络百科数据源进行海量知识的抽取,而面向中文百科数据源进行的知识抽取研究工作尚处于起步阶段。[方法/过程] 为解决中文大规模知识库的构建问题,提出一种新的基于中文网络百科架构的大规模知识库的自动化构建方法:在第一阶段,对知识三元组中的主语和宾语之间的语义关系进行自扩展学习;在第二阶段,基于条件随机场和支持向量机协同分类器,对标注出的属性和属性值实体之间的语义关系进行预测。[结果/结论] 实验评测结果表明,该方法较前人工作在典型中文百科分类页面中的实体识别查准率和查全率分别最高有约10%和6%的提升。  相似文献   

9.
细粒度情感分析研究综述   总被引:2,自引:0,他引:2  
[目的/意义] 对细粒度情感分析研究进展进行调研和总结,探讨其关键问题、关键技术及未来研究趋势。[方法/过程] 采用文献调研方法,从不同粒度层次的情感分析视角,对粗粒度情感分析到细粒度情感分析的演进过程进行阐述,对细粒度情感分析的实现技术和方法进行归类总结。[结果/结论] 总结细粒度情感分析的两个重要问题:情感词抽取和评价对象属性抽取。本研究有助于了解现阶段细粒度情感分析研究的关键问题及关键方法。  相似文献   

10.
数字图书馆数值知识元检索系统设计   总被引:1,自引:0,他引:1  
[目的/意义]为满足数字图书馆用户对数值知识的个性化检索需求,向其提供细粒度的知识服务。[方法/过程]基于对数值知识元的深入分析,提出数字图书馆数值知识元识别、抽取、索引与检索方法,并构建一个面向数值知识元的检索系统。[结果/结论]通过实例分析验证基于数值知识元的细粒度知识服务能够在一定程度上提高检索和利用数值知识的效率和用户满意度。  相似文献   

11.
知识图谱使用“实体—关系—实体”模型描述数据,其构建包括知识抽取、知识融合、知识推理和更新、知识存储等流程。引入知识图谱的图书馆智能化资源推荐系统分为数据采集、知识图谱构建、智能化推荐三大模块,通过抽取资源信息和用户信息构建信息资源和用户画像知识图谱,然后以智能化的算法实现信息资源的智能推荐。  相似文献   

12.
网络学术文档细粒度聚合本体构建研究   总被引:2,自引:0,他引:2  
[目的/意义] 旨在探索网络学术文档细粒度聚合本体构建的理论和方法。[方法/过程] 在梳理相关理论与方法的基础上,首先明晰细粒度聚合本体概念的基本类型、粒度特征和定义等基本理论问题,然后以网络环境下图书情报学领域"引文分析"主题语料为数据来源,从概念、属性和关系、实例等方面对细粒度聚合单元本体构建进行逐一探讨,并对本体进行评估和讨论。[结果/结论] 首次提出基于聚合单元知识体系构建细粒度聚合本体的思路与方法,可为基于聚合单元的细粒度组织、检索和导航中知识组织系统工具的构建提供参考。  相似文献   

13.
[目的/意义]数据科学作为一个融合诸多领域的新兴交叉学科正在快速形成。从数据科学招聘的公告信息中,抽取出相应的实体知识不仅有助于从市场的角度了解数据科学的发展动态,而且有助于改进数据科学教学的内容。[方法/过程]基于各大招聘网站职位招聘公告,结合情报学的数据获取、标注和组织方法,构建数据科学招聘语料库并从中抽取相应的实体进行分析与研究。[结果/结论]在搜集到的11 000篇经过标注的职位招聘公告语料的基础上,基于Bi-LSTM-CRF、CRF和Bi-LSTM模型,对数据科学招聘实体的抽取任务进行性能的对比,确定最终的数据科学招聘实体自动抽取模型,设计数据科学招聘实体自动抽取平台,并构建数据科学招聘实体网络。  相似文献   

14.
[目的/意义]学术全文本下的关系抽取是学术全文本知识图谱构建的关键技术,所构建的学术知识图谱能够实现文献的结构化、知识化,提高研究人员检索文献、分析文献和把握科研动态的效率,以及通过图谱的认知推理,有助于隐式知识发现.[方法/过程]通过外部知识来增强关系抽取已在不少研究取得成果,但针对特定领域的关系抽取往往缺少可用的外...  相似文献   

15.
[目的/意义]基于知识图谱的口述历史档案资源知识发现是知识发现在数字人文领域的新尝试,为资源细粒度关联、语义化查询、个性化探索提供新路径。[方法/过程]以南京师范大学抗战老兵口述资料中心数据为数据源构建抗战老兵口述历史档案资源知识图谱,基于图谱实例,从项目整体概况、事件主题关系、社会网络关系、时空网络关系等层面开展多维知识发现研究。[结果/结论]以知识图谱为代表的数字人文技术方法为知识发现研究提供有力的工具支撑,为人文资源深度开发注入了全新动能。  相似文献   

16.
[目的/意义]在线医疗信息抽取是实现医疗信息检索、医疗信息推荐、个人医疗健康提醒及警示、疾病诊断、公众健康监控、药物不良反应挖掘等服务的基础环节,而医疗实体抽取则是在线医疗信息抽取的首要工作。本文拟解决传统医疗实体抽取严重依赖于人工特征提取且效率低的问题。[方法/过程]以网络文本为研究对象,首先对医疗实体类型和医疗实体抽取的目标进行描述。将在线医疗文本中的医疗实体抽取任务看作序列标注问题来解决,通过对CNN模型和BiLSTM模型基础理论的探讨,构建基于混合深度学习模型CNN-BiLSTM的医疗实体抽取框架。[结果/结论]通过三组对比实验,验证了本文所使用的CNN-BiLSTM模型在医疗实体抽取任务中的有效性。  相似文献   

17.
考察特定领域文本中蕴含的细粒度知识实体的使用情况,对知识实体的评估和选择具有重要意义。学术文本中的细粒度知识实体通常具有多个类型、多种关联关系,挖掘知识实体的同质与异质关联关系,有助于深入了解特定领域知识实体的实际使用情况。目前相关研究大多针对学术文本中单一知识实体的抽取和评估,缺乏对知识实体间关系的关注,在一定程度上限制了基于实体抽取进行知识发现的能力。文章以自然语言处理领域为例,对学术论文全文中的细粒度知识实体关联数据进行挖掘,并通过可视化方式揭示关联数据中蕴含的信息。主要是选取全国计算语言学会议2009-2018年间收录的中文论文为原始语料,人工标注论文中使用的知识实体,并针对NLP特点将其细分为“指标实体”“工具实体”“资源实体”“方法实体”4种类型;结合关联规则挖掘算法Apriori和复杂网络分析软件构建知识实体关联网络,揭示该领域常用的知识实体,以及这些知识实体的使用相关性。  相似文献   

18.
利用实体解析的跨社交媒体同一用户识别   总被引:1,自引:0,他引:1  
[目的/意义] 跨领域关联实体一直是实体解析研究的主题,本文旨在不同的社交媒体(跨社交媒体)中找到属于同一用户的账户。[方法/过程] 在传统近似字符串匹配技术的基础上,提出使用属性值结合社交媒体中的链接和文本内容的方法,比较两个不同社交媒体账户的属性相似度、邻域相似度和关键词相似度这三个匹配函数,以此提高识别这两个账户是否是同一个人的精确度。并利用社交媒体Facebook和Twitter数据作为实验数据集,针对匹配函数的不同组合进行试验。[结果/结论] 结果表明,三个匹配函数的组合能够得到更多的账户匹配为同一用户,同时精确度也很高,达到0.923。本文提出的方法在Facebook和Twitter上的成功运用,给其他社交媒体平台或者其他领域的实体关联的研究提供了一条新的路径。  相似文献   

19.
唐诗知识图谱的构建及其智能知识服务设计   总被引:2,自引:0,他引:2  
[目的/意义]立足于当前大数据环境下的唐诗知识服务需求,以大规模唐诗数据为基础构建唐诗知识图谱并提供智能知识服务,推动人工智能环境下唐诗知识管理和知识服务方式的创新。[方法/过程]本文在对领域知识服务需求调研的基础上,设计领域知识服务驱动的唐诗本体模型,然后利用从Web上爬取的多源异构数据,采用知识抽取、知识融合、知识推理等技术自动构建唐诗知识图谱,统一表示和组织唐诗领域数据,实现对大规模唐诗数据的语义化处理。[结果/结论]本文设计基于唐诗知识图谱的智能知识服务平台KnowPoetry,提供唐诗领域的知识探索、时空轨迹、语义查询等智能化知识服务,推动人工智能环境下唐诗数字人文研究方法的创新转型。  相似文献   

20.
[目的/意义]知识图谱对于重构数字人文资源、促进资源共享重用和深度开发具有重要意义。通过协作智能充分结合人类智慧和机器智能,有助于实现高效、优质的知识图谱构建。[方法/过程]提出基于协作智能构建数字人文领域知识图谱的PDC工作模式,结合数字人文领域知识图谱构建中的核心任务,分析人与AI的分工与协作,并总结在这一过程中协作智能逐渐由人类主导转向AI主导的趋势。[结果/结论]进一步展示基于协作智能的家谱知识图谱构建的可行性和有效性,重点探索家谱知识抽取中的协作智能,并通过定性和定量的评价展示协作智能的优势。协作智能不仅是未来数字人文知识图谱构建的发展趋势,对于其他领域的数字资源组织和知识图谱构建的实践亦具有一定的参考价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号