共查询到20条相似文献,搜索用时 140 毫秒
1.
2.
【目的/意义】面对海量非结构化的数据,如何快速准确地检索到目标信息,实现相关信息的自动关联,是语
义检索和智能推荐的研究重点。【方法/过程】为解决该问题,提出了一种基于本体的JESS推理模型。以目前常用的
形式概念分析法(FCA)(应用于知识采集)及描述逻辑(应用于知识表达)为基础进行相关术语和概念的抽取,探讨
两者在使用过程中的问题及不协调处,并提出改进方式。在基于LCS原则上,探索新增概念及上下级关联架构。
然后利用本体建模工具protégé构建领域本体,建立基于推理引擎JESS的检索查询系统,进行检索。【结果/结论】实
证研究表明,该本体模型支持基于语义推理的智能查询,并能提高查全率及查准率。 相似文献
3.
MeSH、本体论在医学知识组织中的作用 总被引:9,自引:0,他引:9
医学知识工程的关键是医学知识的组织,即将已积累的信息资源按照一定的知识体系组织起来.通过分析研究<医学主题词表>(MeSH)和本体论(ontology)在医学知识组织中的作用和特点,建议应发挥<医学主题词表>描述概念的精准和本体网状构架的优势,提出构建医学领域本体的原则,并可以利用网上提供的免费软件将建立好的医学领域本体转为医学主题图,实现医学的知识组织. 相似文献
4.
【目的/意义】智慧数据是数据资源价值挖掘的承载,其中语义丰富化方法是促成智慧数据的重要手段。语
义丰富化方法及相关实践为智慧数据建设提供参考与借鉴。【方法/过程】从语义丰富化方法的技术角度出发,梳理
语义丰富化与关系型数据库、本体以及关联数据的关系,继而对语义丰富化在医学健康、数字出版、文化遗产等领
域的应用实践展开分析和归纳。【结果/结论】语义丰富化是利用语义网以及文本挖掘、相似度计算等相关技术将数
字资源中隐含的语义关系显性化,并在不同的资源间构建语义链接,促进数字资源的互通、互联与集成。由于数字
资源语义化层次、粒度与面向领域等存在的差异,智慧数据的实现需要语义丰富化诸多方法的有效集成框架。【创
新/局限】本文分析了数据网络中数字资源向数据资源转化的新方法,但仅局限于语义丰富化在部分领域中的应
用,还需丰富和扩展资料,总结语义丰富化的框架和应用分析。 相似文献
5.
6.
【目的/意义】使用人工或常用软件工具获取本体概念及概念间关系已无法满足自媒体环境下大数据的本
体构建及维护的要求,本文尝试用自动或半自动方式予以实现。【方法/过程】对电子商务领域原始语料进行分句、
分词等预处理,构建领域语料库;使用基于语言学以及统计学的方法提取电子商务领域本体概念,同时提出基于混
合策略的本体概念抽取方法;然后使用基于语言学、聚类的方法提取电商领域本体概念与概念之间存在的分类关
系,使用基于关联规则挖掘的方法抽取其本体概念与概念之间存在的非分类关系。【结果/结论】将文本挖掘与本体
构建结合起来,提出了领域本体概念及概念间关系自动抽取与本体构建方法,实验表明使用本体框架 Jena利用此方
法可以自动构建电子商务领域本体,并可将其应用到通用的语义检索系统中。 相似文献
7.
【目的/意义】突发事件新闻具有连续性特征,现存的语义模型无法很好地表示这一特征,通过构建突发事
件新闻语义模型可以实现对这些连续性信息的深层次语义描述和利用。【方法/过程】本文根据由表及里的建模思
维,构建了一个突发事件新闻深层次语义描述本体模型。该模型分为元数据和内容语义两部分,内容语义部分以
事件为起点、以连续性情景和动作为核心。在对突发事件新闻案例进行语义描述的基础上,实现了语义检索、语义
推理、语义数据可视化分析等应用。【结果/结论】通过语义标注和应用实验,验证了该模型的可用性。【创新/局限】本
文提出的突发事件新闻本体模型,较好地解决了突发事件新闻连续性信息的语义标注问题。 相似文献
8.
9.
【目的/意义】通过概念层次关系自动抽取可以快速地在大数据集上进行细粒度的概念语义层次自动划分,
为后续领域本体的精细化构建提供参考。【方法/过程】首先,在由复合术语和关键词组成的术语集上,通过词频、篇
章频率和语义相似度进行筛选,得到学术论文评价领域概念集;其次,考虑概念共现关系和上下文语义信息,前者
用文献-概念矩阵和概念共现矩阵表达,后者用word2vec词向量表示,通过余弦相似度进行集成,得到概念相似度
矩阵;最后,以关联度最大的概念为聚类中心,利用谱聚类对相似度矩阵进行聚类,得到学术论文评价领域概念层
次体系。【结果/结论】经实验验证,本研究提出的模型有较高的准确率,构建的领域概念层次结构合理。【创新/局限】
本文提出了一种基于词共现与词向量的概念层次关系自动抽取模型,可以实现概念层次关系的自动抽取,但类标
签确定的方法比较简单,可以进一步探究。 相似文献
10.
11.
【目的/意义】学术论文的结构功能是学术论文篇章结构和语义内容的集中体现,目前针对学术论文结构功
能的研究主要集中在对学术论文不同层次的识别以及从学科差异性视角探讨模型算法的适用性两方面,缺少模
型、学科、层次之间内在联系的比较研究。【方法/过程】选择中医学、图书情报、计算机、环境科学、植物学等学科中
文权威刊物发表的学术论文作为实验语料集,在引入CNN、LSTM、BERT等深度学习模型的基础上,分别从句子、
段落、章节内容等层次对学术论文进行结构功能识别。【结果/结论】实验结果表明,BERT模型对于不同学科学术论
文以及学术论文的不同层次的结构功能识别效果最优,各个模型对于不同学科学术论文篇章内容层次的识别效果
均最优,中医学较之其他学科的学术论文结构功能识别效果最优。此外,利用混淆矩阵给出不同学科学术论文结
构功能误识的具体情形并分析了误识原因。【创新/局限】本文研究为学术论文结构功能识别研究提供了第一手的
实证资料。 相似文献
12.
【目的/意义】爆发式增长的文献资源为传统的阅读活动带来了困难,也给STM图书的组织与服务提出了
新的要求。图书标注框架是图书内容与形式的规范化表示,对于解决图书的深度标引和知识关联具有重要意义。
【方法/过程】首先从用户需求出发明确了STM图书资源标注框架的构建原则,而后从图书的物理特征、内容特征、
增强特征和使用特征4个维度设计了本文框架包含的实体对象及其语义关系,最后展现了利用该框架进行STM图
书知识建模表示的过程,并通过应用案例验证了本文框架的可用性。【结果/结论】该标注框架具有需求驱动、多维
揭示、深度描述和语义关联等特征,对于支持STM图书资源的上层服务具有参考价值。【创新/局限】本文设计了
STM图书资源的标注框架,并选取应用实例探究其知识揭示与表达能力,但未能从知识服务视角对标注结果开展
进一步的应用研究。 相似文献
13.
【目的/意义】电子健康记录信息作为医学健康信息资源的重要组成部分,其共享整合问题一直是当前克服
医疗信息资源“孤岛化”现象、实现医学知识服务的重点和难点,对国外电子健康记录语义整合研究进展进行分析
综述,旨在为我国后续研究提供借鉴和参考。【方法/过程】本文运用文献调查法,以电子健康记录信息资源转化为
知识资源为主线,梳理出电子健康记录语义整合的主题框架及发展态势。【结果/结论】电子健康记录语义整合是
一个集专业性和社会性高度融合的动态知识组织过程,未来研究可能关注的问题有:医学细分专业的互操作标准
建设、语义关联方式的开放透明问题、按需提供知识服务的模式研究以及开放获取与隐私保护的利益平衡问题
等。【创新/局限】对国外近期EHR语义整合研究主题进行分析和评述,并提出研究进展中的重点和趋势。 相似文献
14.
【目的/意义】中医医案中包含的隐性知识具有巨大的价值,通过数据挖掘技术对中医医案进行分析,挖掘
临床医案中的隐性知识,有利于知名中医个人知识经验的传承和中医理论知识的积累和拓展。【方法/过程】收集中
医医案中患者的主诉和现病史,并对主诉和现病史进行数据清洗,通过基于cart算法的数据挖掘技术挖掘中医医案
中的隐性知识,探究病症与患者症候各个属性之间的关系。【结果/结论】本文以胃脘痛为例,发现了胃脘痛与患者
症候各个属性之间的相关程度,为数据挖掘技术在中医医案隐性知识挖掘研究提供借鉴。【创新/局限】本文采用的
cart算法判断胃脘痛与患者属性之间的相关性与医案中确诊结果进行比较,得出该方法相关性准确率高于ID3算
法、C4.5算法和SLIQ算法,判断相关性最高。 相似文献
15.
【目的/意义】高校人事档案管理是高校人事管理的重要组成部分,为高校长足发展提供决策支持。大数据
时代的到来,为我国高校人事档案的管理与利用带来了机遇与挑战,为了使高校人事档案管理顺应数据化发展趋
势,应积极推动档案管理从数字化向数据化转型。【方法/过程】通过对高校人事档案数据化管理与利用进行研究,
辨析数字化与数据化的内涵,对人事档案的组织流程展开详细分析,提出实现数据化的具体路径,为有关实践提供
有益的参考。【结果/结论】文章描述了人事档案数据化建设在整体框架层面的具体流程组织,阐述了数据归集、语
义组织、数据挖掘与分析和数据利用与服务四个流程内容。【创新/局限】本文创新性地提出了人事档案数据化建设
的实现路径。 相似文献
16.
【目的/意义】本文利用多源数据,通过对科技文献作者的名称进行消歧,使作者与科技文献呈一一对应的
关系。【方法/过程】本文提出首先将采集的多源数据进行预处理,形成了同一姓名作者文献组成的待消解的重名数
据集,通过合作关系构建学术圈以发现歧义,最后通过机构和领域进行消歧。【结果/结论】实验采集了各级教育、自
动化及计算机技术、信息与知识传播、数理科学和化学、无线电电子学、中国医学等6个不同的学科的文献题录数
据,本文提出的基于规则的消歧具有良好的消歧效果。通过多源数据融合、机构和领域多指标消歧,能够达到较高
的消歧效果。【创新/局限】解决了同机构同领域消歧的难题,并考虑了增量问题,构建了完整的消歧模型。 相似文献
17.
【目的/意义】探测特定领域政策文本语义主题,揭示我国政策部署领域与未来发展趋势。【方法/过程】提出
一种融合词向量语义增强和DTM模型的公共政策文本时序建模与可视化方法,采用DTM模型实现政策文本的时
序切割和主题建模,利用深度学习Word2vec算法中Skip-gram词嵌入技术可以对上下文词汇进行有效预测,增强
其语义表达性和政策解释性,以更为准确地揭示我国公共政策的部署重点。【结果/结论】实验表明本文提出的方法
对于公共政策主题识别和政策文本量化具有更好的知识抽取和语义表达能力,对我国公共政策挖掘和信息揭示具
有良好的揭示。【创新/局限】提出融合词向量语义增强和DTM模型的公共政策文本时序建模方法,一定程度上提
升了政策文本的主题语义表达,未来考虑利用深度学习技术如LSTM算法、BERT模型等识别政策中的领域知识单
元和语法结构。 相似文献
18.
【目的/意义】针对基于关键词的科技文献聚类研究进行了一些探讨,包括:使用具有不同特征的关键词来
实现文献聚类在效果上有何差异;如何按特征对关键词进行选择来提高文献聚类效果。【方法/过程】按照关键词词
频与语义类型特征设置对照组进行实证研究,观察其对文献聚类密度及文献语义表示效果的影响。【结果/结论】单
独使用具有超高频、次高频、研究主题或限定范围特征的关键词进行文献聚类能使聚类密度较为合适;超高频特征
通常在其他频次中都具有体现,次高频词能同时反映不同频次的关键词特征,但次高频词对中频词特征的表示不
够全面;将语义类型不同的关键词分开来实现文献聚类,其效果好于将关键词进行组配,语义类型不同的关键词间
存在互斥性。【创新/局限】本文发现了在以关键词间的共现关系为基础来进行文献聚类时单独选择次高频或某一
语义类别的关键词来实现文献聚类具有较好效果,但缺少对关键词间语义结构关系的进一步研究。 相似文献
19.
【目的/意义】在线健康信息的有效组织对提升全民身体素质具有重要的社会价值。【方法/过程】在分析健
康信息主题、关联关系和资源标引的基础上,构建基于主题图的在线健康信息标签语义挖掘模型,从而构建了健康
信息标签主题图并实现了其可视化导航、浏览和检索等功能。【结果/结论】基于主题图的在线健康信息标签语义挖
掘模型能够准确的发现在线健康信息与信息标签间的深层关系,可以更好地揭示在线健康信息标签的语义关联,
为用户提供信息的可视化浏览和导航功能、提升健康信息的组织效果,帮助用户健康信息获取。【创新/局限】本文
将主题图与健康信息标签相结合,提高了健康信息的检索效率和利用效率,但本文也存在着不足,例如标签样本量
和样本范围较小,缺乏专业医学研究者的参与。 相似文献
20.
【目的/意义】规划类企业在开展业务过程中积攒了大量的图纸以及文档,这些数据被搁置难以进行有效利
用,语义互联视角下规划类企业数据资产管理的研究成为一个全新且亟待解决的问题。【方法/过程】对语义互联下
规划类企业进行数据特性分析,并以配电网规划设计企业为例,构建配电网设计企业工作数据管理一体化模型,提
出语义互联视角下规划设计数据管理工作运行机理,并以YH配网设计企业的数据管理实践来验证理论的正确
性。【结果/结论】论文提出的数据资产管理模型和具体方法有很强的通用性,对其他类型企业也有很强的借鉴意
义。【创新/局限】从语义互联视角下构建了规划类企业数据资产管理模型,完善了规划类企业数据资产管理工作,
但是其他类型企业数据资产管理工作仍有较大提升空间。 相似文献