共查询到20条相似文献,搜索用时 31 毫秒
1.
2.
【目的/意义】通过概念层次关系自动抽取可以快速地在大数据集上进行细粒度的概念语义层次自动划分,
为后续领域本体的精细化构建提供参考。【方法/过程】首先,在由复合术语和关键词组成的术语集上,通过词频、篇
章频率和语义相似度进行筛选,得到学术论文评价领域概念集;其次,考虑概念共现关系和上下文语义信息,前者
用文献-概念矩阵和概念共现矩阵表达,后者用word2vec词向量表示,通过余弦相似度进行集成,得到概念相似度
矩阵;最后,以关联度最大的概念为聚类中心,利用谱聚类对相似度矩阵进行聚类,得到学术论文评价领域概念层
次体系。【结果/结论】经实验验证,本研究提出的模型有较高的准确率,构建的领域概念层次结构合理。【创新/局限】
本文提出了一种基于词共现与词向量的概念层次关系自动抽取模型,可以实现概念层次关系的自动抽取,但类标
签确定的方法比较简单,可以进一步探究。 相似文献
3.
【目的/意义】实现对领域本体分类关系的自动学习识别,解决领域本体知识框架结构体系的自动化构建问
题。【方法/过程】通过对领域本体分类关系自动识别的国内外研究现状及存在问题进行分析总结,以当前开源的先
进的深度学习文本预训练模型BERT为基础,研究构建了基于BERT的领域本体分类关系自动识别模型,并以资源
环境学科领域为例进行了实验研究和评估分析。【结果/结论】基于BERT构建的分类模型能够实现对领域本体分类
关系的自动识别,识别方法和流程具有极大地通用性和可移植性,识别精度比传统方法有了较大提升。【创新/局
限】微调与泛化了BERT,提高了领域本体分类关系识别模型的通用性和精度。但由于受分类标注语料的质量限
制,模型精度尚未达到峰值,有待进一步优化提升。 相似文献
4.
参考已有电子商务领域本体,本文提出一种基于用户兴趣本体学习的文本过滤模型.其中利用web挖掘技术构建带有权重的概念及概念间分类与非分类关系,以此基础上进行文本过滤,经验证,基于该本体的文本过滤质量有明显提高. 相似文献
5.
【目的/意义】在对本体构建的过程中,为了避免繁杂冗余信息,约简绝对不必要属性,保留核心属性与相
对必要属性,以最核心的信息精确反映概念格及本体结构,提出了一种基于FCA与属性约简的本体合并方法。【方
法/过程】首先对不同资源进行形式化处理,然后采用并叠置方法获得形式背景,并对形式背景进行属性约简与约
简后的协调集判断,最终将约简集转换为相应的概念格,使用protege 3.4 工具构建实验本体。【结果/结论】实验结
果表明,对异构资源进行形式背景的属性约简有效地提高了本体构建效率,进一步丰富了概念间隐含的语义关系。 相似文献
6.
【目的/意义】面对海量非结构化的数据,如何快速准确地检索到目标信息,实现相关信息的自动关联,是语
义检索和智能推荐的研究重点。【方法/过程】为解决该问题,提出了一种基于本体的JESS推理模型。以目前常用的
形式概念分析法(FCA)(应用于知识采集)及描述逻辑(应用于知识表达)为基础进行相关术语和概念的抽取,探讨
两者在使用过程中的问题及不协调处,并提出改进方式。在基于LCS原则上,探索新增概念及上下级关联架构。
然后利用本体建模工具protégé构建领域本体,建立基于推理引擎JESS的检索查询系统,进行检索。【结果/结论】实
证研究表明,该本体模型支持基于语义推理的智能查询,并能提高查全率及查准率。 相似文献
7.
【目的/意义】互联网上的信息资源日益丰富,开放信息源成为一些领域知识获取的重要渠道。本文以中医 领域为例,为向本体和知识图谱的构建提供数据,提出了一种基于开放信息源的知识挖掘方法。【方法/过程】在缺 乏领域训练语料的情况下,先获取一部分语料,使用规则模板、词向量结合词分类的方法获取部分领域实体词,通 过回标文本语料得到训练集,再使用条件随机场进行实体的识别和抽取。【结果/结论】本文提出的规则结合 SVM-CRF实体抽取模型具有较高的有效性和通用性。在所使用的中医实体中,方剂和症型实体的抽取准确率仍 待进一步提升。 相似文献
8.
9.
10.
[目的/意义]实现对领域概念的自动学习抽取,解决领域本体自动化构建的首要基础任务。[方法/过程]以无监督的学习方法和端到端的识别模式为理论技术基础,首先通过对主流词嵌入模型进行对比分析,设计提出了基于Word2Vec和Skip-Gram的领域文本特征词嵌入模型的自动生成方法;其次研究构建了以IOB格式的标注文本作为输入,基于自注意力机制的BLSTM-CRF领域概念自动抽取模型;最后以资源环境学科领域为例进行了实验研究与评估分析。[结果/结论]模型能够实现对领域概念的自动抽取,对领域新概念或术语的自动识别也具有一定的健壮性。[局限]模型精度尚未达到峰值,有待进一步优化提升。 相似文献
11.
12.
【目的/意义】作为医疗与管理科学领域最为重要的研究课题之一,在线健康社区智能诊疗在我国“互联网+
医疗”新业态发展背景下扮演重要角色。【方法/过程】本文从本体论与CBR视角出发,构建基于知识库与案例库的
在线健康社区诊疗解决方案自动推理模型;通过八爪鱼采集器获取“好大夫在线”疾病科普以及医患问答数据构建
本体,并利用文本分析挖掘出可解释的疾病知识及解决方案,分别实现知识库与案例库的半自动构建;以成年人先
天性心脏病为例,将 ACHD-AP进行形式化定义,采用推理引擎对患者案例进行风险分类及划分至对应的疾病知
识库,并实现诊疗解决方案的自动推理。【结果/结论】研究显示,本文诊疗解决方案推理结论与专家建议相似度较
高,且OntoQA评估下的知识库以及案例库本体层次结构关系合理。【创新/局限】基于知识库与案例库的诊疗解决
方案自动推理模型为后续在线健康社区实现智能诊疗以及服务模式的创新提供了方法上的参考。 相似文献
13.
【目的/意义】本文基于概念格构建了高校图书馆群体用户兴趣画像,揭示不同群体用户的行为需求,挖掘 潜在的行为规律,为高校图书馆不同群体用户的个性化服务提供参考。【方法/过程】以高校图书馆为服务主体,对 服务对象进行细化和分类,利用Con Exp1.3工具构建不同群体用户类别的细分标签,并生成Hasse图,深入挖掘用 户的行为属性和需求特征,通过概念格“Calculate Association Rule”对不同群体的用户行为进行关联规则挖掘,实现 群体兴趣画像的精准刻画。【结果/结论】借鉴概念格的方法,能够更加清晰和全面的展示层级关系,识别群体用户 的需求属性和行为特征,进而探索用户之间的关联,有助于提升高校图书馆的服务质量,提升服务效率。 相似文献
14.
【目的/意义】实体关系抽取是构建领域本体、知识图谱、开发问答系统的基础工作。远程监督方法将大规
模非结构化文本与已有的知识库实体对齐,自动标注训练样本,解决了有监督机器学习方法人工标注训练语料耗
时费力的问题,但也带来了数据噪声。【方法/过程】本文详细梳理了近些年远程监督结合深度学习技术,降低训练
样本噪声,提升实体关系抽取性能的方法。【结果/结论】卷积神经网络能更好的捕获句子局部、关键特征、长短时记
忆网络能更好的处理句子实体对远距离依赖关系,模型自动抽取句子词法、句法特征,注意力机制给予句子关键上
下文、单词更大的权重,在神经网络模型中融入先验知识能丰富句子实体对的语义信息,显著提升关系抽取性能。
【创新/局限】下一步的研究应考虑实体对重叠关系、实体对长尾语义关系的处理方法,更加全面的解决实体对关系
噪声问题。 相似文献
15.
16.
【目的/意义】文献挖掘是文本挖掘领域中的重要研究方向,文献挖掘技术在信息化时代发挥着越来越重要
的作用。【方法/过程】首先在文献挖掘过程中引入知识元概念,提出了一套基于知识元的文献挖掘处理模式。其次
针对海关贸易档案文献资料,提出了一种五元组结构的知识元表示方法,并用领域知识元本体进行领域知识元间
的组合链接。同时针对期刊文献资料,提出了五类知识元共同表示一篇期刊文献的知识元表示方法。最后以“粤
海关”相关贸易档案文献资料和中文期刊文献资料为例,运用所提方法进行知识元的抽取和表示,在知识元的基础
上进行知识元间的组合链接进而实现快速精确的领域知识挖掘。【结果/结论】基于知识元的文献挖掘模型,能够增
强文献挖掘过程的可重复操作性并提高挖掘成果的可重复利用性。 相似文献
17.
【目的/意义】金融领域实体关系抽取是构造金融知识库的基础,对金融领域的文本信息利用具有重要作
用。本文提出金融领域实体关系联合抽取模型,增加了对金融文本复杂重叠关系的识别,可以有效避免传统的流
水线模型中识别错误在不同任务之间的传递。【方法/过程】本文构建了高质量金融文本语料,提出一种新的序列
标注模式和实体关系匹配规则,在预训练语言模型BERT(Bidirectional Encoder Representations from Transformers)
的基础上结合双向门控循环单元 BiGRU(Bidirectional Gated Recurrent Units)与条件随机场 CRF(Conditional
Random Field)构建了端到端的序列标注模型,实现了实体关系的联合抽取。【结果/结论】针对金融领域文本数据
进行实验,实验结果表明本文提出的联合抽取模型在关系抽取以及重叠关系抽取上的F1值分别达到了0.627和
0.543,初步验证了中文语境下本文模型对金融领域实体关系抽取的有效性。【创新/局限】结合金融文本特征提出
了新的序列标注模式并构建了基于BERT的金融领域实体关系联合抽取模型,实现了对金融文本中实体间重叠关
系的识别。 相似文献
18.
本文重点阐述了中文通用本体概念实例的机器抽取过程,建立了基于模式匹配的通用本体概念识别模型,以此作为领域本体自动构建的基础.此后探讨了该模型在情报学各研究领域中的应用前景,并通过实验检验模型在实际应用中的识别效果. 相似文献
19.
【目的/意义】构建基于司法判决书的案件知识图谱是对司法数字资源的有效利用,有助于提升司法智能化
水平,积极响应国家“智慧法院”建设发展战略。【方法/过程】以“网络诈骗”领域为例,用“自顶向下”的方式构建知
识图谱。首先,结合文书内容与专家意见构建案件领域本体;接着,通过知识抽取、知识表示、知识融合等环节获取
实体、属性及关系;再利用Neo4j生成案件知识图谱。最后,提出了基于知识图谱的智慧司法知识服务框架。【结果/
结论】基于 2015年-2020年的“网络诈骗”领域司法判决书,构建了含有约 3万个实体和 18万条关系的案件知识图
谱,并详细阐述了具备基础资源层、知识图谱层、服务应用层的智慧司法知识服务框架设计。【创新/局限】实现了案
件知识图谱的实体类型扩充,以丰富图谱应用场景,并将知识图谱技术与智慧司法知识服务框架进行融合;局限在
于仅使用网络诈骗领域判决书数据进行实证研究。 相似文献
20.
【目的/意义】从大数据驱动角度出发,探索采用人工智能方法实现对政策文本协同性定量分析的可能性。
【方法/过程】以政策全文本数据为研究对象,使用知识图谱技术实现不同主题的本体构建,并应用数据挖掘中关联
规则构建推理模型,对图谱表示的政策文本进行协同性语义挖掘和推理。【结果/结论】围绕“开放数据”和“数据安
全”主题构建知识图谱,实现对政策文本的本体表示,在此基础上使用关联规则完成单文本和多文本在两个主题间
的协同性分析。【创新/局限】本文将知识图谱应用于政策文本分析领域,并完成协同性分析,为政策的全样本分析
提供可能性,后续需扩大样本规模,提升推理效率。 相似文献