首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
鲍玉来  耿雪来  飞龙 《现代情报》2019,39(8):132-136
[目的/意义]在非结构化语料集中抽取知识要素,是实现知识图谱的重要环节,本文探索了应用深度学习中的卷积神经网络(CNN)模型进行旅游领域知识关系抽取方法。[方法/过程]抓取专业旅游网站的相关数据建立语料库,对部分语料进行人工标注作为训练集和测试集,通过Python语言编程实现分词、向量化及CNN模型,进行关系抽取实验。[结果/结论]实验结果表明,应用卷积神经网络对非结构化的旅游文本进行关系抽取时能够取得满意的效果(Precision 0.77,Recall 0.76,F1-measure 0.76)。抽取结果通过人工校对进行优化后,可以为旅游知识图谱构建、领域本体构建等工作奠定基础。  相似文献   

2.
彭博  童兆莉 《情报科学》2023,(3):100-108
【目的/意义】面对网络中大量由非结构化数据构成的文化遗产信息资源,如何从中抽取知识构建知识图谱并进行应用研究,是新媒体时代进行文化遗产知识深度利用的基础。【方法/过程】文章首先根据信息资源的内容与结构特征按照主题与类型进行分类,随后采用有针对性的关键词抽取方法获取概括信息资源主题的关键词,通过SPARQL检索在外部知识库中进行文化遗产信息资源的命名实体识别,最后利用词汇相似度算法依托本体进行知识融合,构建文化遗产信息资源知识图谱。【结果/结论】在实验中进行了网络文化遗产信息资源的知识抽取与知识图谱构建,利用深度学习进行文化遗产知识推理,开展了知识图谱的应用研究。研究结果表明文章方法能够充分利用网络中的文化遗产信息资源进行知识图谱构建,满足多种应用场景下分析需求。【创新/局限】由于文化遗产领域内容庞大,有关研究数据有待进一步扩充以更好的研究文章方法的适用性。  相似文献   

3.
王志宇  刘雨薇 《现代情报》2024,(3):47-58+119
[目的/意义]利用政务微博信息构建自然灾害知识图谱,旨在为相关部门加强自然灾害事件的管理提供知识层面的参考价值。[方法/过程]以森林火灾事件为例,选取政务微博信息资源,首先使用LDA主题模型划分微博资源主题;其次构建自然灾害知识图谱的模式层和数据层,包括本体构建、实体抽取、关系抽取和数据融合等环节;最后使用Neo4j图数据库实现自然灾害知识图谱的存储与检索,实现自然灾害信息的组织与可视化。[结果/结论]构建了基于主题划分的自然灾害知识图谱,实现了自然灾害信息的主题知识关联与规范化处理,对提升政府部门防范与管理自然灾害的科学决策水平具有积极作用。  相似文献   

4.
黄茜茜  杨建林 《情报科学》2022,39(2):133-140
【目的/意义】构建基于司法判决书的案件知识图谱是对司法数字资源的有效利用,有助于提升司法智能化 水平,积极响应国家“智慧法院”建设发展战略。【方法/过程】以“网络诈骗”领域为例,用“自顶向下”的方式构建知 识图谱。首先,结合文书内容与专家意见构建案件领域本体;接着,通过知识抽取、知识表示、知识融合等环节获取 实体、属性及关系;再利用Neo4j生成案件知识图谱。最后,提出了基于知识图谱的智慧司法知识服务框架。【结果/ 结论】基于 2015年-2020年的“网络诈骗”领域司法判决书,构建了含有约 3万个实体和 18万条关系的案件知识图 谱,并详细阐述了具备基础资源层、知识图谱层、服务应用层的智慧司法知识服务框架设计。【创新/局限】实现了案 件知识图谱的实体类型扩充,以丰富图谱应用场景,并将知识图谱技术与智慧司法知识服务框架进行融合;局限在 于仅使用网络诈骗领域判决书数据进行实证研究。  相似文献   

5.
[目的/意义]为满足船舶领域科研或工程人员在知识问答、质量分析等方面的业务分析需求,提升科研工作效率与知识获取便利性、精准性。[方法/过程]围绕结构化、半结构化、非结构化等船舶领域多源异构数据,文章从质和量两方面提出了船舶领域知识图谱构建方法,基于船舶领域概念图谱与实体图谱构建,实现知识图谱“质”的描述;通过对实体间关联关系进行统计分析与建模分析,建立面向业务应用场景的量化分析模型;最终以问答推理为例,展示了从质和量两方面开展面向业务场景知识图谱构建的通用过程。[结果/结论]通过以舰艇涂料失效知识图谱构建为例,验证了在质和量两个方面构建知识图谱的正确性,该方法能够为业务场景分析提供有效支撑。  相似文献   

6.
【目的/意义】通过构建上海市名人故居知识图谱,可以强化沪上名人故居非结构化数据的知识组织问题,为后续历史名人故居学术资源相关研究提供思路和借鉴方法,也为游客选择名人故居游提供便利。【方法/过程】本文基于沪上名人故居用户需求及旅游领域相关行业标准,首先采用自顶向下的方式设计沪上名人故居知识图谱框架,之后以此框架为基础通过序列标注、机器学习等方法填充图谱的实体、关系及属性为沪上名人故居的知识图谱构建提供数据支撑,最后运用Neo4j图数据库对沪上名人故居知识图谱进行可视化存储。【结果/结论】沪上名人故居知识图谱构建实现了资源的可视化存储及语义检索,能够提供数据浏览与知识展示,数据查询与知识检索、知识关联与信息推荐等功能,为后续智能问答、智能信息推荐的应用研究奠定基础。【创新/局限】本研究结合用户需求及上海市名人故居数据结构特点,建构了沪上名人故居知识图谱框架,为后续名人故居知识组织相关研究提供了思路。本文数据的选取仅限于上海市内的知名名人故居,有关研究数据有待进一步扩充以更好地研究文章方法的适用性。  相似文献   

7.
【目的/意义】本文提出了借助知识图谱的知识互联和可视化分析等功能,为公共危机事件智能治理提供知 识支撑的观点。【方法/过程】以“港独”为例,从新华网、人民网、中国新闻网等“港独”新闻语料中抽取实体,构建公 共危机事件知识图谱模型。从知识图谱本体构建和实体数据填充两个方面,对“港独”知识图谱的实体抽取、关系 抽取、知识融合、知识加工和知识推理等构建环节进行重点论述和实践,最后,利用Neo4j数据库实现知识存储,生 成的“港独”知识图谱。【结果/结论】通过Cypher语句对“港独”知识图谱进行查询,能够呈现可视化语义网结构图, 利于知识隐重发现。【创新/局限】本文的创新之处在于把知识图谱技术应用于公共危机事件治理中,为其智能查 询和决策分析提供数据支持。在今后实践中,数据源的选取不必局限于网络新闻语料,还可以适当对“港独”人员 的微博、微信、论坛中的信息进行采集和抽取,以此扩大知识关联,从而更为全面、高效地进行公共危机事件智能 治理。  相似文献   

8.
李叶叶  李贺  沈旺  曹阳  涂敏 《情报科学》2022,39(2):65-73
【目的/意义】随着网络购物的普及,在线评论成为影响消费者、销售者和生产者决策的重要数据。大数据 时代,在线评论呈现出多源异构、爆发式增长的特点,难以为用户的购买决策和商家竞争提供有力的情报支撑。【方 法/过程】本文利用多源异构的在线评论数据构建知识图谱,提出了一种基于多源异构数据构建知识图谱的框架, 模式层构建围绕在线评论的信源、内容以及形式构建,最终形成知识图谱的概念框架,并运用word2vec从多源异构 文本中获取实体、关系和属性,并进行数据融合与知识图谱分析。【结果/结论】实验部分以手机商品在线评论为例, 验证了本文所构建的知识图谱对在线评论相关研究及挖掘的有效性,研究结果揭示了多源异构在线评论数据的特 点,为大数据环境下在线评论信息组织、展示和挖掘提供了新的研究视角。【创新/局限】运用知识图谱对在线评论 进行描述,有效解决信息过载、多源异构信息融合等问题。本文采用半自动化的方式构建知识图谱,未来考虑引入 无监督的方法提高构建效率。  相似文献   

9.
韩普  叶东宇  陈文祺  顾亮 《现代情报》2023,(10):27-34+151
[目的/意义]随着网络化和数字化的快速发展,线上线下医疗健康活动产生了海量多模态数据,当前迫切需要一种更为完善的知识组织方法,对类型繁多、专业性强的医疗健康多模态数据进行序化和组织。[方法/过程]首先对多模态数据进行预处理以构建多模态医疗健康数据集;接着基于实体对齐和关系抽取实现医疗健康数据的知识单元抽取,并通过知识评估和融合构建多模态知识单元;然后在多模态知识单元和知识图谱基础上提出一种面向多模态医疗健康数据的知识组织模式;最后以文本和图像模态数据为例,以医疗健康问答系统为实践应用进行分析和验证。[结果/结论]针对多模态医疗健康数据的内在特性,基于多模态知识图谱和语义知识组织框架,提出一种面向多模态医疗健康数据的知识组织模式。本研究推进了多模态知识组织的理论深度,可为医疗健康领域知识序化、精准知识服务和深度知识发现提供有效支撑。  相似文献   

10.
[目的/意义]近年来,科技文献资源呈爆炸性增长,海量科技文献中依旧存在大量非结构化摘要。非结构化摘要一方面不利于学者阅读与理解;另一方面不利于对摘要内部信息进行知识的自动化抽取和相应的检索。研究科技文献非结构化摘要的知识表示模型及其自动化抽取方法,对学者快速阅读和机器自动化处理具有重要意义。[方法/过程]文章在分析科技文献非结构化摘要结构的基础上,结合知识元本体理论,构建了一个面向科技文献非结构化摘要的知识元本体模型。通过分析非结构化摘要的写作特征,将文本按句子级划分为目的、方法、结果或结论三个要素,统计每个要素句中的线索词、句型和位置,建立相关规则库,根据本体模型和规则库构建相关抽取算法。最后,下载《计算机技术与发展》中的部分文献进行实验。[结果/结论]通过增加句型集和线索词集,完善了非结构化摘要的要素,构建了非结构化摘要知识元本体模型。实验结果表明,根据本文提出的模型能有效地对非结构化摘要中的知识元进行抽取。[局限]实验的不足之处是需要人工对摘要中的句型和线索词进行归纳总结。  相似文献   

11.
基于规则的学术概念属性抽取   总被引:2,自引:0,他引:2  
学术文献作为科研成果的结晶,蕴含着丰富的知识,属性抽取作为知识抽取的一种应用,是把不同学术文献中对于某一学术概念的属性描述集中起来,用来构建属性描述知识库。本文通过人工构建规则的方法,形成了属性抽取的九大类描述规则,并对属性描述进行了数量关系和情感信息方面的分析,然后对学术概念属性抽取系统进行设计和实现,并对《情报学报》2007年和2008年的文章进行抽取实验,对系统抽取的结果和人工标记的结果进行了测评,并进行了实验结果的分析。  相似文献   

12.
[目的/意义] 借助知识图谱对区域政务微博内容进行知识组织与可视化展示,能够提升用户的知识阅读及获取效率。[方法/过程] 首先,基于LDA模型对区域政务微博进行主题建模,通过依存句法分析对微博内容进行语义三元组抽取。其次,构建了区域政务微博知识模型,形成了知识图谱的语义架构。最后,借助图数据库Neo4j及D3.js插件实现了区域政务微博的知识图谱可视化及关联化保存。[结果/结论] 经理论构型与实际验证,本研究构建了基于主题划分的区域政务微博知识图谱,为社交媒体内容的知识图谱构建提供了一定的思路及方法。  相似文献   

13.
【目的/意义】在新冠肺炎疫情中,科学数据为疫情分析、管控和治理提供了重要的依据和支撑,为实现新冠肺炎科学数据的价值最大化,有必要构建新冠肺炎科学数据集元数据框架。【方法/过程】文章以Re3data.org中的新冠肺炎科学数据集为例,在对科学数据集元数据进行收集整理后,构建新冠肺炎科学数据集元数据框架,利用Protégé软件实现科学数据集本体构建,并借助图数据库Neo4j对所构建的知识图谱进行存储。【结果/结论】结果表明,对Re3data.org中的新冠肺炎科学数据集元数据进行关联融合,将元数据转化为多元化的数据存储及展示形式。【创新/局限】实现了新冠肺炎科学数据集知识图谱的构建,并且在图谱之中进行实体及其关系的查询检索和推理,细粒度地创建了科学数据集本体中各个部分属性、实体之间的关联,未来还应侧重跨平台科学数据集元数据的关联与融合。  相似文献   

14.
何巍 《情报杂志》2024,(1):160-166
[研究目的]信息技术的发展丰富了社交媒体用户的沟通交流方式,研究社交网络舆情多模态知识图谱的构建对网络舆情治理具有重要的现实意义。[研究方法]基于多模态数据的语义互补,讨论了实体属性关联、图像(视频)文字描述、图像(视频)属性、图像(视频)关联等多种异构数据融合方式。在此基础上,提出社交网络舆情多模态知识图谱的构建框架,并分析了在多模态语义理解、多模态实体对齐、多模态知识表示等方面存在的问题与挑战。[研究结论]提出基于多模态知识融合的社交网络舆情多模态知识图谱构建框架,为交互方式日趋丰富的社交网络舆情治理提供有益参考。  相似文献   

15.
针对航空安全领域积累的海量航空安全事件基础数据未能有效挖掘和充分利用的问题,本文提出了一种航空安全事件知识图谱构建的方法,采用自顶向下的方法从航空安全事故调查报告中抽取模式数据并构建知识图谱的模式图,采用自底向上的方法实现知识图谱数据图的构建,利用Neo4j图数据库实现了图数据的存储与管理,采用可视化方式实现了航空安全事件知识图谱的展示与信息统计,为提升民航突发事件应急管理提供良好的数据支持。  相似文献   

16.
[目的/意义]知识图谱作为数智时代一种先进的知识组织方式,能够为数字人文研究提供良好的技术支持,去洞察那些以往在文本资源中看不见的隐含联系和知识结构。[方法/过程]《山海经》是中国上古三大奇书,具有非常高的研究价值。本文引入主题图和Neo4j等技术和工具,在分析《山海经》中的主题类型、关联关系、属性信息的基础上,提出了构建《山海经》知识图谱的技术架构、数据模型、实施步骤。[结果/结论]将多源异构数据进行集成,完成了《山海经》知识图谱的构建和展示,对于将知识图谱技术应用于数字人文研究领域做了有益的探索。  相似文献   

17.
[目的/意义]文章旨在深化对知识图谱的认识,并对构建军事知识图谱提出指导性思路和经验。[方法/过程]从广义角度提出了对知识图谱概念的新认识。结合典型通用图谱,深入剖析了知识图谱的内在关系、建设模式和途径,分析了存在的现实问题。[结果/结论]从理论认识和实操指导层面设计了军事领域知识图谱建设的基本流程,分析了重点环节及建设思路,提出了针对军事知识图谱应用的实践认识和体会。  相似文献   

18.
[目的/意义]随着大数据和人工智能时代的来临,基于数据驱动的医疗辅助决策以及医疗健康知识挖掘受到人们的极大关注。医疗知识图谱是医疗信息分析和知识服务的基础,在医疗人工智能和医疗信息检索中发挥着重要作用。[方法/过程]本文以医疗领域的实际应用需求为出发点,从医疗大数据获取、医疗实体及关系标注、医疗实体识别、医疗实体链接、医疗实体关系挖掘、中文医疗知识图谱表示和存储等关键技术入手,提出了多数据源融合的医疗知识图谱构建的理论框架。[结果/结论]面向医疗领域的知识图谱构建是一项非常重要的基础任务,同时也是人工智能领域的重要发展方向。  相似文献   

19.
[目的/意义]从研究成果中抽取数据线索,进而构建针对特定主题的数据索引,有助于提升研究者查找数据的全面性。[方法/过程]以社会科学领域所有学科中文核心期刊中关于“COVID-19”论文的题录信息为例,分三步进行了探索。(1)随机抽取1000篇摘要进行人工标注,然后以此为基础使用自适应增强等模型训练分类器,进而使用分类器识别出使用了数据的论文。(2)从使用数据的论文摘要中标注出数据线索实体,进而使用隐马尔可夫、长短期记忆网络等模型进行实体识别。(3)使用Neo4j数据库,基于抽取出的数据线索与题录中的其他信息构建知识图谱。[结果/结论]在判断论文是否使用了数据的任务中,自适应增强模型的F1值最高,达到0.869。在数据线索实体识别任务中,隐马尔可夫模型的F1值最高,达到0.805。由抽取出的数据线索与论文关键词、作者、期刊等信息融合构建的知识图谱能够实现基于主题词查找数据线索、基于数据线索查找其他信息等应用。  相似文献   

20.
航天产品研制中面临知识资源分散、结构化程度不高、体系化程度不够等诸多问题,需要对知识资源进行结构化处理,形成规范的知识模型,以实现后续的知识识别、解析、挖掘等。知识模型的构建与所属领域紧密相关,本文面向航天领域的知识资源,从知识分类、知识要素提取、要素间关系分析等维度,提出知识模型构建原则和方法,以文档类知识、软件类知识、图纸类知识为典型类别,基于本体思想,分析知识模型构建流程,并提出构建实例,为产品研发中知识体系的构建提供支撑。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号