首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
【目的/意义】本文希望通过自动化本体构建将非结构化的用户生成内容组织成为语义丰富的本体。【方法/ 过程】综合运用机器学习、自然语言处理等技术,从用户生成内容中抽取本体概念、同义关系及分类关系,形成领域 本体,并且通过京东商城用户评论进行实证。【结果/结论】本文实现了手机本体的自动构建,发现该模型能够达到 较高准确率,消除了大量冗余,更符合用户需求。  相似文献   

2.
【目的/意义】通过概念层次关系自动抽取可以快速地在大数据集上进行细粒度的概念语义层次自动划分, 为后续领域本体的精细化构建提供参考。【方法/过程】首先,在由复合术语和关键词组成的术语集上,通过词频、篇 章频率和语义相似度进行筛选,得到学术论文评价领域概念集;其次,考虑概念共现关系和上下文语义信息,前者 用文献-概念矩阵和概念共现矩阵表达,后者用word2vec词向量表示,通过余弦相似度进行集成,得到概念相似度 矩阵;最后,以关联度最大的概念为聚类中心,利用谱聚类对相似度矩阵进行聚类,得到学术论文评价领域概念层 次体系。【结果/结论】经实验验证,本研究提出的模型有较高的准确率,构建的领域概念层次结构合理。【创新/局限】 本文提出了一种基于词共现与词向量的概念层次关系自动抽取模型,可以实现概念层次关系的自动抽取,但类标 签确定的方法比较简单,可以进一步探究。  相似文献   

3.
基于BERT的领域本体分类关系自动识别研究   总被引:1,自引:0,他引:1       下载免费PDF全文
【目的/意义】实现对领域本体分类关系的自动学习识别,解决领域本体知识框架结构体系的自动化构建问 题。【方法/过程】通过对领域本体分类关系自动识别的国内外研究现状及存在问题进行分析总结,以当前开源的先 进的深度学习文本预训练模型BERT为基础,研究构建了基于BERT的领域本体分类关系自动识别模型,并以资源 环境学科领域为例进行了实验研究和评估分析。【结果/结论】基于BERT构建的分类模型能够实现对领域本体分类 关系的自动识别,识别方法和流程具有极大地通用性和可移植性,识别精度比传统方法有了较大提升。【创新/局 限】微调与泛化了BERT,提高了领域本体分类关系识别模型的通用性和精度。但由于受分类标注语料的质量限 制,模型精度尚未达到峰值,有待进一步优化提升。  相似文献   

4.
参考已有电子商务领域本体,本文提出一种基于用户兴趣本体学习的文本过滤模型.其中利用web挖掘技术构建带有权重的概念及概念间分类与非分类关系,以此基础上进行文本过滤,经验证,基于该本体的文本过滤质量有明显提高.  相似文献   

5.
【目的/意义】在对本体构建的过程中,为了避免繁杂冗余信息,约简绝对不必要属性,保留核心属性与相 对必要属性,以最核心的信息精确反映概念格及本体结构,提出了一种基于FCA与属性约简的本体合并方法。【方 法/过程】首先对不同资源进行形式化处理,然后采用并叠置方法获得形式背景,并对形式背景进行属性约简与约 简后的协调集判断,最终将约简集转换为相应的概念格,使用protege 3.4 工具构建实验本体。【结果/结论】实验结 果表明,对异构资源进行形式背景的属性约简有效地提高了本体构建效率,进一步丰富了概念间隐含的语义关系。  相似文献   

6.
【目的/意义】面对海量非结构化的数据,如何快速准确地检索到目标信息,实现相关信息的自动关联,是语 义检索和智能推荐的研究重点。【方法/过程】为解决该问题,提出了一种基于本体的JESS推理模型。以目前常用的 形式概念分析法(FCA)(应用于知识采集)及描述逻辑(应用于知识表达)为基础进行相关术语和概念的抽取,探讨 两者在使用过程中的问题及不协调处,并提出改进方式。在基于LCS原则上,探索新增概念及上下级关联架构。 然后利用本体建模工具protégé构建领域本体,建立基于推理引擎JESS的检索查询系统,进行检索。【结果/结论】实 证研究表明,该本体模型支持基于语义推理的智能查询,并能提高查全率及查准率。  相似文献   

7.
【目的/意义】互联网上的信息资源日益丰富,开放信息源成为一些领域知识获取的重要渠道。本文以中医 领域为例,为向本体和知识图谱的构建提供数据,提出了一种基于开放信息源的知识挖掘方法。【方法/过程】在缺 乏领域训练语料的情况下,先获取一部分语料,使用规则模板、词向量结合词分类的方法获取部分领域实体词,通 过回标文本语料得到训练集,再使用条件随机场进行实体的识别和抽取。【结果/结论】本文提出的规则结合 SVM-CRF实体抽取模型具有较高的有效性和通用性。在所使用的中医实体中,方剂和症型实体的抽取准确率仍 待进一步提升。  相似文献   

8.
易明  秦涵  蒋武轩 《情报科学》2020,38(2):29-38
【目的/意义】基于标签系统所蕴含的语义信息与隐性社会网络,构建融合标签概念空间及用户网络的语义社 团发现模型,提高社团发现的质量。【方法/过程】通过构建标签的概念空间挖掘标签间的语义关系,并根据标签包 含的隐性社会网络发现用户网络,进而将两者结合融入到社团发现算法中,并以豆瓣网数据对模型进行实证。【结 果/结论】标签概念空间及用户网络能够提升语义社团发现算法效果。  相似文献   

9.
杨婧  常春 《情报科学》2017,35(8):15-18
【目的/意义】针对叙词表概念遴选与词间关系构建的现状,以交叉学科方法研究概念在不同时间节点的变 化规律。【方法/过程】假设学科领域内概念的词频随时间变化规律遵循生态学中Logistic种群增长规律,对专业领域 文献中概念出现的频次进行统计,依据单个概念的成熟周期给出选词判断标准与词间关系的强弱判断依据。【结 果/结论】发现在跨学科视角下,可以通过词频关系为新文献环境词表词间关系的构建提出参考意见。  相似文献   

10.
[目的/意义]实现对领域概念的自动学习抽取,解决领域本体自动化构建的首要基础任务。[方法/过程]以无监督的学习方法和端到端的识别模式为理论技术基础,首先通过对主流词嵌入模型进行对比分析,设计提出了基于Word2Vec和Skip-Gram的领域文本特征词嵌入模型的自动生成方法;其次研究构建了以IOB格式的标注文本作为输入,基于自注意力机制的BLSTM-CRF领域概念自动抽取模型;最后以资源环境学科领域为例进行了实验研究与评估分析。[结果/结论]模型能够实现对领域概念的自动抽取,对领域新概念或术语的自动识别也具有一定的健壮性。[局限]模型精度尚未达到峰值,有待进一步优化提升。  相似文献   

11.
【目的/意义】探讨一种基于已有资源的本体构建新方法。【方法/过程】以《医学主题词表》为例,在概述叙 词表内容结构之后,详尽阐述基于叙词表等级结构及其语义关系的本体构建原则及整个过程,并开发自动处理工 具实现批量叙词表数据的本体构建。【结果/结论】通过收集大规模实验数据进行验证,表明本研究为复用叙词表资 源的本体构建,以及实现不同类型知识组织系统之间的语义共享提供了一种新思路。  相似文献   

12.
盛姝  黄奇  郭进京  解绮雯  杨洋 《情报科学》2022,40(5):161-172
【目的/意义】作为医疗与管理科学领域最为重要的研究课题之一,在线健康社区智能诊疗在我国“互联网+ 医疗”新业态发展背景下扮演重要角色。【方法/过程】本文从本体论与CBR视角出发,构建基于知识库与案例库的 在线健康社区诊疗解决方案自动推理模型;通过八爪鱼采集器获取“好大夫在线”疾病科普以及医患问答数据构建 本体,并利用文本分析挖掘出可解释的疾病知识及解决方案,分别实现知识库与案例库的半自动构建;以成年人先 天性心脏病为例,将 ACHD-AP进行形式化定义,采用推理引擎对患者案例进行风险分类及划分至对应的疾病知 识库,并实现诊疗解决方案的自动推理。【结果/结论】研究显示,本文诊疗解决方案推理结论与专家建议相似度较 高,且OntoQA评估下的知识库以及案例库本体层次结构关系合理。【创新/局限】基于知识库与案例库的诊疗解决 方案自动推理模型为后续在线健康社区实现智能诊疗以及服务模式的创新提供了方法上的参考。  相似文献   

13.
【目的/意义】本文基于概念格构建了高校图书馆群体用户兴趣画像,揭示不同群体用户的行为需求,挖掘 潜在的行为规律,为高校图书馆不同群体用户的个性化服务提供参考。【方法/过程】以高校图书馆为服务主体,对 服务对象进行细化和分类,利用Con Exp1.3工具构建不同群体用户类别的细分标签,并生成Hasse图,深入挖掘用 户的行为属性和需求特征,通过概念格“Calculate Association Rule”对不同群体的用户行为进行关联规则挖掘,实现 群体兴趣画像的精准刻画。【结果/结论】借鉴概念格的方法,能够更加清晰和全面的展示层级关系,识别群体用户 的需求属性和行为特征,进而探索用户之间的关联,有助于提升高校图书馆的服务质量,提升服务效率。  相似文献   

14.
柯佳 《情报科学》2021,39(10):165-169
【目的/意义】实体关系抽取是构建领域本体、知识图谱、开发问答系统的基础工作。远程监督方法将大规 模非结构化文本与已有的知识库实体对齐,自动标注训练样本,解决了有监督机器学习方法人工标注训练语料耗 时费力的问题,但也带来了数据噪声。【方法/过程】本文详细梳理了近些年远程监督结合深度学习技术,降低训练 样本噪声,提升实体关系抽取性能的方法。【结果/结论】卷积神经网络能更好的捕获句子局部、关键特征、长短时记 忆网络能更好的处理句子实体对远距离依赖关系,模型自动抽取句子词法、句法特征,注意力机制给予句子关键上 下文、单词更大的权重,在神经网络模型中融入先验知识能丰富句子实体对的语义信息,显著提升关系抽取性能。 【创新/局限】下一步的研究应考虑实体对重叠关系、实体对长尾语义关系的处理方法,更加全面的解决实体对关系 噪声问题。  相似文献   

15.
利用本体扩展查询是语义检索的主流方向,如何构建完善的本体是亟待解决的问题,现对本体构建中概念及其同义关系的自动获取进行研究。每个概念用上下文特征词表示,利用完全加权关联规则挖掘概念集,将频繁项作为具有同义关系概念的特征词,包含这些频繁项的概念中的一个将作为本体概念。并规定概念的特征词权重量化表示,基于此对任意两个同义概念的相似度进行计算。实验表明该方法获取的同义概念精确度和计算效率高于半自动方式。  相似文献   

16.
魏伟  郭崇慧  唐琳  陈静锋 《情报科学》2017,35(6):138-144
【目的/意义】文献挖掘是文本挖掘领域中的重要研究方向,文献挖掘技术在信息化时代发挥着越来越重要 的作用。【方法/过程】首先在文献挖掘过程中引入知识元概念,提出了一套基于知识元的文献挖掘处理模式。其次 针对海关贸易档案文献资料,提出了一种五元组结构的知识元表示方法,并用领域知识元本体进行领域知识元间 的组合链接。同时针对期刊文献资料,提出了五类知识元共同表示一篇期刊文献的知识元表示方法。最后以“粤 海关”相关贸易档案文献资料和中文期刊文献资料为例,运用所提方法进行知识元的抽取和表示,在知识元的基础 上进行知识元间的组合链接进而实现快速精确的领域知识挖掘。【结果/结论】基于知识元的文献挖掘模型,能够增 强文献挖掘过程的可重复操作性并提高挖掘成果的可重复利用性。  相似文献   

17.
【目的/意义】金融领域实体关系抽取是构造金融知识库的基础,对金融领域的文本信息利用具有重要作 用。本文提出金融领域实体关系联合抽取模型,增加了对金融文本复杂重叠关系的识别,可以有效避免传统的流 水线模型中识别错误在不同任务之间的传递。【方法/过程】本文构建了高质量金融文本语料,提出一种新的序列 标注模式和实体关系匹配规则,在预训练语言模型BERT(Bidirectional Encoder Representations from Transformers) 的基础上结合双向门控循环单元 BiGRU(Bidirectional Gated Recurrent Units)与条件随机场 CRF(Conditional Random Field)构建了端到端的序列标注模型,实现了实体关系的联合抽取。【结果/结论】针对金融领域文本数据 进行实验,实验结果表明本文提出的联合抽取模型在关系抽取以及重叠关系抽取上的F1值分别达到了0.627和 0.543,初步验证了中文语境下本文模型对金融领域实体关系抽取的有效性。【创新/局限】结合金融文本特征提出 了新的序列标注模式并构建了基于BERT的金融领域实体关系联合抽取模型,实现了对金融文本中实体间重叠关 系的识别。  相似文献   

18.
王昊  苏新宁 《情报理论与实践》2008,31(2):292-297,291
本文重点阐述了中文通用本体概念实例的机器抽取过程,建立了基于模式匹配的通用本体概念识别模型,以此作为领域本体自动构建的基础.此后探讨了该模型在情报学各研究领域中的应用前景,并通过实验检验模型在实际应用中的识别效果.  相似文献   

19.
黄茜茜  杨建林 《情报科学》2022,39(2):133-140
【目的/意义】构建基于司法判决书的案件知识图谱是对司法数字资源的有效利用,有助于提升司法智能化 水平,积极响应国家“智慧法院”建设发展战略。【方法/过程】以“网络诈骗”领域为例,用“自顶向下”的方式构建知 识图谱。首先,结合文书内容与专家意见构建案件领域本体;接着,通过知识抽取、知识表示、知识融合等环节获取 实体、属性及关系;再利用Neo4j生成案件知识图谱。最后,提出了基于知识图谱的智慧司法知识服务框架。【结果/ 结论】基于 2015年-2020年的“网络诈骗”领域司法判决书,构建了含有约 3万个实体和 18万条关系的案件知识图 谱,并详细阐述了具备基础资源层、知识图谱层、服务应用层的智慧司法知识服务框架设计。【创新/局限】实现了案 件知识图谱的实体类型扩充,以丰富图谱应用场景,并将知识图谱技术与智慧司法知识服务框架进行融合;局限在 于仅使用网络诈骗领域判决书数据进行实证研究。  相似文献   

20.
韩娜  马海群  刘兴丽 《情报科学》2021,39(11):180-186
【目的/意义】从大数据驱动角度出发,探索采用人工智能方法实现对政策文本协同性定量分析的可能性。 【方法/过程】以政策全文本数据为研究对象,使用知识图谱技术实现不同主题的本体构建,并应用数据挖掘中关联 规则构建推理模型,对图谱表示的政策文本进行协同性语义挖掘和推理。【结果/结论】围绕“开放数据”和“数据安 全”主题构建知识图谱,实现对政策文本的本体表示,在此基础上使用关联规则完成单文本和多文本在两个主题间 的协同性分析。【创新/局限】本文将知识图谱应用于政策文本分析领域,并完成协同性分析,为政策的全样本分析 提供可能性,后续需扩大样本规模,提升推理效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号