共查询到18条相似文献,搜索用时 125 毫秒
1.
提出一种新的领域本体学习方法,结合形式概念分析(FCA)与关联规则挖掘从非结构化文本中获取情报学本体。该方法从文本集中通过种子-扩展机制的方法获取领域核心概念,构建文档概念格(文档×关键词矩阵),在此基础上通过形式概念分析方法来识别概念之间的等级关系,通过关联规则挖掘概念间的相关关系。最后,采用基于"黄金标准"的方法对本体学习的结果进行评价,结果表明:通过这种方法构建的本体可以达到较高的领域知识覆盖率,而且能够识别概念之间部分隐含的关系,从而验证该方法在领域本体的构建中实用且有效。 相似文献
2.
为获取中文领域本体的概念提出了基于规则匹配和统计方法相结合的学习模型,充分利用现有的自然语言处理技术和统计学习方法,从领域文本中通过语义串切分、规则匹配、领域归属度分析和概念约简算法自动获取领域概念.该方法解决了现有中文本体学习方法对领域词典的依赖以及无法获得短语式特定领域概念的问题,同时解决了领域概念筛选问题.实验证明了该方法的有效性. 相似文献
3.
航空领域本体构建研究 总被引:3,自引:1,他引:2
本文对领域本体构建方法选择原则进行了研究,在提出领域本体构建方法设计与选择原则的基础上,根据航空本体的特点,提出了基于<中国航空百科词典>的航空领域本体构建方法.该方法通过尽可能复用现有术语,重视框架设计与概念间关系规划环节,将概念间关系确定尽可能通过计算机自动完成,人工工作量少,领域专家参与少.通过本方法试验,初步构建出了航空领域本体,在较短的时间内构建出了航空本体.论文针对进化在本体构建中的重要性,在构建方法中重点论述了航空领域本体进化方法,按流程对本体进化中的新词获取、概念及关系确定、版本标识、进化周期等工作环节进行了系统研究. 相似文献
4.
5.
术语的抽取是领域本体构建的基础工作,决定了本体构建的质量.获取的术语除了要求有准确的短语识别率,还要求有较高的术语领域度.本文试图研究一种不依赖于背景语料的术语领域度筛选方法.本文的主要工作集中在两个方面:一是通过统计和规则相结合的方法从领域语料中抽取候选术语(短语),二是提出了通过候选术语的分布度、活跃度以及主题度进行计算的多策略术语抽取方法,并通过实验进行了验证和分析.实验结果表明,在小规模航空航天领域语料库上进行验证性实验后发现,在不大量增加计算时间复杂度的情况下,能够有效提高领域术语抽取的质量,获得令人较满意的结果. 相似文献
6.
7.
从Wikipedia 中获取本体:原理与方法研究 总被引:1,自引:0,他引:1
Wikipedia 作为一个大型的知识库,正逐渐被人们应用于不同的领域.在本体构建领域,Wikipedia 以其丰富的组织结构为大规模协作式的本体学习提供了有效的环境,利用Wikipedia 进行本体学习逐渐成为一个新的研究热点.本文从这一角度出发,在剖析Wikipedia 基本结构的基础上,分析和比较了从类别结构图、信息盒和定义句中获取本体概念和实例的相关原理和方法,阐述了利用Wikipedia 获取本体关系的原理,分析了基于结构特征、基于词典、基于句法和基于混合方式的模式匹配方法,以及基于结构特征和文本特征的统计学习方法,并对利用各种方法获取本体关系的效果进行了比较. 相似文献
8.
本体理论及在农业文献检索系统中的应用研究——以花卉学本体建模为例 总被引:1,自引:0,他引:1
本体(ontology)的概念起源于哲学领域,古希腊哲学家亚里士多德将本体定义为研究“存在”的科学,即研究整个客观世界基本特征的科学。20世纪90年代以来,人们将本体的概念引人人工智能、知识工程和图书情报领域,从而使本体概念的内涵也随之发生了变化。这些领域中,一般来说,本体研究是关于知识概念表示和知识组织体系方面的研究。在图书情报领域,本体通常是指一套有关某一学科或某一领域的术语词表,以及术语之间关系的规范和说明。近年来,关 相似文献
9.
领域本体的半自动构建方法研究 总被引:2,自引:0,他引:2
人机协作的半自动构建本体是目前较为理想的模式。借鉴软件工程中的领域建模、图书馆学中的分类学和本体学习的方法论,由领域专家给出领域的上层知识模式,通过机器学习技术从领域语料库中学习等级关系和相关关系为知识工程师提供参考,将专家的自顶向下和机器学习的自底向上的结果结合起来构建本体。半自动构建领域本体的关键技术在于领域概念的获取和组织,用共现统计算法、关联规则算法、隐含语义索引、Hopfield联想算法获取相关关系,用聚类算法、字面成族、模式匹配获取等级关系,从而完成领域类模型的构建。 相似文献
10.
基于统计自然语言处理技术的领域本体半自动构建研究 总被引:1,自引:0,他引:1
本体的构建是影响语义Web成功与否的重要因素之一.本文借鉴机器学习以及自然语言处理等技术成果尝试半自动构建本体,以专业研究论文为研究语料,采用N-Gram文本表达法从语料中抽取关键概念,计算主题度获取领域概念.利用改进的层次聚类算法对领域概念进行聚类以获取其等级体系,采用句法分析与统计相结合的方法从语料中获取可能的主、谓、宾模式为领域关系提供参考,并以农业史为例,设计开发了一个领域本体半自动构建实验系统,文中重点介绍了本体构建中概念的获取、等级关系、领域关系的构建以及形式化处理等关键技术的实现过程. 相似文献
11.
学术资源本体非等级关系抽取研究 总被引:1,自引:1,他引:0
[目的/意义] 概念非等级关系抽取是本体构建的必要步骤,学术文献作为一种重要的学术资源类型,本文主要利用其结构特点来进行本体概念非等级关系的抽取。[方法/过程] 首先,在本体概念抽取的基础上,对文献中概念的类型进行分类,以便于后期关系动词搭配的概念类型来排除不符合条件的三元组;其次,确定学术文献中的关系类型,并采用C-value方法抽取表示关系的动词,进行本体关系的表示;再次,评价概念对的关联性,利用互信息法对概念对进行排序并去除非相关概念对,实验表明该方法非常有效;最后评价概念对与关系动词的关联,分析影响三元组关联的因素,再采用实验确定模型挖掘三元组,实验比较现有的关联规则挖掘的方法。[结果/结论] 结果表明本文提出的三元组选择模型效果明显超过现有的关联规则挖掘方法,并且在语料集扩大的情况下这种优势更为明显。 相似文献
12.
基于学术文献构建领域本体对促进领域学科发展具有重要的意义。本文提出了一种以中文学术文献为数据源,半自动化抽取领域本体层次关系的框架方法。首先,构建了一个通用的领域本体层次关系的细粒度研究框架。其次,设计了一种新的概念表示方法,融合了深度学习方法得到的概念语义特征和上下文的时间序列词频。进一步结合了AP聚类、Prim算法和Web搜索引擎的查询数据,提出了基于规则推理的本体概念层次关系抽取算法(RROCHE),实现了半自动化概念层次关系抽取。最后,基于中文分词领域的中文学术文献数据,通过数值实验方法讨论了方法的可行性和有效性。本文提出的框架方法也非常容易推广并应用到各领域本体层次关系任务中。 相似文献
13.
14.
面向语义Web的智能数字图书馆的实现很大程度上依赖于本体的建立,本体与数字图书馆中的数字资源采集、数字馆藏和用户访问网关都密切相关。在本体构建方面,目前存在的绝大多数本体都是手工生成的,该方法效率低、出错率高,更难以维护和更新。这对语义级数字图书馆的实现造成了巨大的障碍。为此提出了一种面向数字图书馆的本体学习方法GOLF,通过对各专业领域中大量的Web文档集和语料库进行挖掘来实现本体学习,并分别讨论了本体学习中本体概念的抽取、概念之间语义关系的抽取和分类体系的自动构建等关键技术。 相似文献
15.
建立教育本体的常见矛盾包括:定义本体采取自上而下还是自下而上的方法;教材连续性与概念连续性顾及哪头;核心问题是自下而上路线能否表现教材结构。文章调和矛盾双方:在自下而上路线上批判地复用教材的半结构化知识组织元素,萃取术语集及关联;在自上而下路线上借用软件工程,在可视化顶部吸纳思维导图模式以顺应人的学习习惯,在概念下层接入本体,从而经济地推动机器思维和人类认识认知的统一,建成符合人类学习原理和认知特点的知识组织。 相似文献
16.
17.
STKOS中领域本体模型框架研究 总被引:4,自引:0,他引:4
[目的/意义] 构建普适的领域本体模型框架和规范的方法体系,为STKOS实现动态建模的本体工具集和面向领域应用的本体网络提供建设依据。[方法/过程] 调研分析不同层次的领域本体模型,总结能够为STKOS本体建设提供的参考,构建STKOS中学科领域本体模型的3层架构,提出各层框架可遵循的方法,并以中国科学院植物研究所的需求为例,阐述本文模型框架在构建植物多样性领域本体的应用。[结果/结论] 按照领域本体模型3层架构所构建的植物多样性领域本体较之其他领域本体,具有知识组织体系清晰、构建过程高效、所支撑应用场景丰富的优点,因此,该研究可为STKOS快速而有效地构建领域本体提供实用框架,未来可应用于知识服务平台语义层的建设。 相似文献