首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 234 毫秒
1.
本体技术可以有效的解决各种异构信息的转换和集成问题,但是现阶段人们却缺乏有效的自动本体构建方法.本文根据现有的图情专业学术文献数据库,提出一种利用引文关键词共现技术的领域本体自动构建方法.该方法利用引文分析思想来计算文献的学术价值,并以此来计算文献和引用文献的词语共现对权重值,完成了本体结构中层次概念联系的表达和设计,同时还利用基于加权词语共现对序列相似度的算法实现了同义概念联系的抽取.最后,本文就相关实验及其结论做了详细的说明.  相似文献   

2.
为充分发挥知识组织在企业专利战略中的作用,在分析专利文献的基础上,根据中文专利文献句法描述的特点,利用最大串频匹配、蚁群聚类、多层KMeans聚类、改进关联规则计算、基于规则和CRFs的术语关系抽取等算法,设计出一套领域本体的半自动构建系统,包括术语抽取、分类关系抽取、非分类关系抽取、本体形式化等模块,初步实现结构化数据和非结构化文本的本体半自动构建。  相似文献   

3.
种子概念方法及其在基于文本的本体学习中的应用   总被引:4,自引:0,他引:4  
介绍基于文本的本体学习及其层次,分析本体学习中术语获取的主要方法。针对术语获取中存在的问题,在术语形成的经济规律基础上,引入种子概念方法,并利用统计和规则两种方法抽取与种子概念相关的领域术语;证明种子概念方法是一种有效获取领域术语的方法。实验证明少量种子词可以获取大量领域术语,为本体构建提供基础和框架。  相似文献   

4.
学术资源本体非等级关系抽取研究   总被引:1,自引:1,他引:0  
蒋婷  孙建军 《图书情报工作》2016,60(20):112-122
[目的/意义] 概念非等级关系抽取是本体构建的必要步骤,学术文献作为一种重要的学术资源类型,本文主要利用其结构特点来进行本体概念非等级关系的抽取。[方法/过程] 首先,在本体概念抽取的基础上,对文献中概念的类型进行分类,以便于后期关系动词搭配的概念类型来排除不符合条件的三元组;其次,确定学术文献中的关系类型,并采用C-value方法抽取表示关系的动词,进行本体关系的表示;再次,评价概念对的关联性,利用互信息法对概念对进行排序并去除非相关概念对,实验表明该方法非常有效;最后评价概念对与关系动词的关联,分析影响三元组关联的因素,再采用实验确定模型挖掘三元组,实验比较现有的关联规则挖掘的方法。[结果/结论] 结果表明本文提出的三元组选择模型效果明显超过现有的关联规则挖掘方法,并且在语料集扩大的情况下这种优势更为明显。  相似文献   

5.
面向数字图书馆的本体自动构建   总被引:1,自引:0,他引:1  
提出一种面向数字图书馆的本体自动构建方法:首先从因特网数据中找出本体语义概念的模式及其关系,然后通过构建概念分类体系来自动化地抽取数字图书馆的各类本体。包括以下步骤:术语选择、抽取本体概念、语义关系抽取、分类体系构建、本体构建和本体修剪及评价。图3。参考文献3。  相似文献   

6.
基于领域本体的信息抽取模式生成与系统实现   总被引:1,自引:0,他引:1  
马静  吴一占  刘思峰 《情报学报》2008,27(2):193-198
面对情报工作者日益增长的从Internet中及时获取特定信息或知识的需求,本文展开了web信息抽取技术在情报领域的应用研究.目前,信息抽取模式的自动获取成为一个技术难点,本文尝试引入基于领域本体的半自动抽取模式获取算法,该方法在领域本体的概念层次关系、属性特征和实例的结构本体指导下,选择其主要特征属性为匹配目标,自动学习并获取抽取模式.利用该算法到直升机产品信息抽取,运行结果验证:该算法简单有效,获得了较高的抽取效率和较准确的抽取结果.  相似文献   

7.
从多个RDFS本体中抽取子本体   总被引:4,自引:0,他引:4  
RDFS本体提供了用于表达语义信息的通用框架,是语义网的基础。本体规模的增大使得对于特定领域知识利用的效率降低,从中抽取领域子本体可解决此问题。单个本体中包含的领域知识有限,从多个本体中抽取子本体可获取更多的领域知识。将RDFS本体抽象为图模型,根据RDFS推理规则和本体间映射,生成多个RDFS源本体的联合闭包。应用图理论构建抽取算法,生成以领域概念为节点的子图,得到所需的领域本体。该方法对于RDFS层次的领域本体抽取有一定的适用性,可快速有效地构建领域本体。  相似文献   

8.
本文基于术语共现理论,利用形式概念分析中概念格的自动生成来推理作为属性的领域专业术语的层次结构并进行可视化展示,进而提出了一整套用于实现领域本体概念层次关系构建的解决方案,具体包括文档/词汇与术语语义关联的识别、领域形式化背景的建立、基于形式概念分析的主题概念的生成、基于主题概念格的术语层次关系抽取、术语层次体系的OWL描述和图形展示等.笔者以“白血病”领域为例,详细论证了无知识库支持环境下中文文本到医学学科术语层次结构的衍化过程,并对以文档术语矩阵(DTM)和词汇术语矩阵(WTM)为形式化背景生成的术语层次体系进行了比较分析.  相似文献   

9.
基于统计自然语言处理技术的领域本体半自动构建研究   总被引:1,自引:0,他引:1  
本体的构建是影响语义Web成功与否的重要因素之一.本文借鉴机器学习以及自然语言处理等技术成果尝试半自动构建本体,以专业研究论文为研究语料,采用N-Gram文本表达法从语料中抽取关键概念,计算主题度获取领域概念.利用改进的层次聚类算法对领域概念进行聚类以获取其等级体系,采用句法分析与统计相结合的方法从语料中获取可能的主、谓、宾模式为领域关系提供参考,并以农业史为例,设计开发了一个领域本体半自动构建实验系统,文中重点介绍了本体构建中概念的获取、等级关系、领域关系的构建以及形式化处理等关键技术的实现过程.  相似文献   

10.
数据驱动下,与日俱增的电子政务信息资源愈发表现出多源异构的特性,基于大规模语料设计一套电子政务领域内中文术语深度层次关系的自动化识别方案,不仅有利于从内容与结构层面弥补人工构建领域词表的不足,且对于我国政务信息资源的开放共享与后续应用更具有重大现实意义。因此,本文分别基于内容与结构双重视角识别电子政务主题词表内术语间的深层关联,通过谱聚类生成的基于内容的层次关系为初步框架,凭借形式概念分析生成的基于结构的层次关系为后期修正指导,以期构成兼顾关联术语召回率与准确率的电子政务领域术语本体。研究结果显示,电子政务术语本体的层次结构合理有效,且术语层次关系的评价结果表明知识本体具备良好的扩展性和延伸性。  相似文献   

11.
以清晰表达知识内涵、促进本体语义共享为目的,以医学文献知识为研究案例,文章基于UMLS语义网络顶级本体语义关系构筑了领域本体属性关系,并通过医学文献知识本体的构建,阐述了依托顶级本体的语义关系构筑领域本体语义的方法,探讨了基于顶级本体语义的领域本体通用构建途径,实现了医学文献本体的语义关系系统化,为领域本体的建模提供了思路。  相似文献   

12.
面向知识处理的领域本体及其应用研究   总被引:3,自引:0,他引:3  
本体是关于领域概念及概念之间关系的精确描述。本文给出面向知识处理的领域本体模型及其描述语言。一个本体由实例、类、属性、关系和类间关系等元素组成。在给出领域知识本体模型的基础上,给出了基于框架的领域知识本体表示语言、三层组织结构以及本体的公理体系。在领域本体的驱动下,以数学家知识获取为例给出一种面向领域的知识获取方法,并给出领域知识语义正确性检查的方法。最后介绍一个领域本体管理和知识获取工具。  相似文献   

13.
为了有效处理文本中的复杂语义问题,提出了一种基于领域本体的SOM文本逐层聚类方法.该方法基于领域本体的概念及其逻辑语义关系,将文本向量的表示从词的层面上升到主题概念层面,大大消减了文本向量的维数,提高了聚类效率.基于领域本体的概念层次关系,采用SOM算法实现文本的逐层聚类,以分层方式组织文档,方便用户由粗到精、由总体到局部地查阅文本集.通过无人机领域的Web文本聚类实验,验证了该方法的有效性.  相似文献   

14.
基于概念和语义层次的领域本体评价研究   总被引:1,自引:0,他引:1  
领域本体评价是本体论和语义网研究中的重要内容.本文提出了一种基于编辑距离对领域本体中概念之间的相似度进行计算的方法.此外,通过比较给定的领域本体和"黄金标准"之间在概念的实例的安排以及概念本身的等级安排上具有的相似性,可以在语义角度对二者做出相似性判断.本文利用一个已有的军用飞机领域的本体和<中国分类主题词表>进行比较计算.实验结果表明,该方法能较为准确地计算出两个本体的概念集的相似性,也能较好地衡量本体之间的语义关系,从而实现对领域本体的有效评价.  相似文献   

15.
现有的数据结构导致CSSCI信息服务产生了检索方式简单化和隐含知识获取难两大问题.通过对CSSCI数据结构和内容特点的分析,提出基于本体面向对象的知识组织方式来重构CSSCI学术资源知识结构的解决方案,并试图通过建立概念层次结构和设置概念属性来构建CSSCI本体概念模型,用于表达该领域的知识组织.可以使用Protégé工具以OWL编码方式和图形可视化方式对概念模型进行合婵描述.图5.表1.参考文献7.  相似文献   

16.
地学数据资源具有多源、分散、异构等特征,为了能够充分共享和利用地学数据资源,必须有效集成并建 立地学数据库,但是传统地学数据建库方法存在着难以系统地认知建库对象,缺乏统一的语义支撑等问题。针对这些 问题,本文提出并定义了地学数据本体模型、概念体系及其构建方法,阐述了基于地学数据本体的数据建库方法和流 程。该方法在数据本体明确语义的支撑下,抽取出完善的数据实体关系模型,实现多源、异构数据的映射、转换与规 范化处理,并利用数据本体准确表达数据库的语义信息。最后以贵州岩溶地下水数据库构建为例,进行了方法的应用 验证。研究表明:地学数据本体通过对数据资源全生命周期共识概念、属性、实例及其关系的形式化描述,可以有效 克服传统地学数据建库方法的缺陷,更好地支撑和促进地学数据资源的集成建库。  相似文献   

17.
为了提高文本挖掘的深度和精度,研究并提出了一种基于领域本体的语义文本挖掘模型.该模型利用语义角色标注进行语义分析,获取概念和概念间的语义关系,提高文本表示的准确度;针对传统的知识挖掘算法不能有效挖掘语义元数据库,设计了一种基于语义的模式挖掘算法挖掘文本深层的语义模式.实验结果表明,该模型能够挖掘文本数据库中的深层语义知识,获取的模式具有很强的潜在应用价值,设计的算法具有很强的适应性和可扩展性.  相似文献   

18.
基于领域本体实现全网信息的智能搜索方法研究   总被引:2,自引:2,他引:0  
为了克服基于关键词匹配的传统搜索引擎不能有效处理复杂语义的问题,提出了一种基于领域本体实现面向整个网络空间的信息智能搜索方法.首先研究了支持网络信息搜索的领域本体结构和表示方法;重点研究了基于领域本体对用户的检索关键词进行语义处理技术,并且设计了一个算法提高语义推理效率;探究了自动调用搜索引擎,按照语义处理后的检索表达式完成全网信息搜索的方法.实验证明,本方法在略有提高查准率的同时,显著提高了网络信息搜索的查全率.  相似文献   

19.
针对中文学术文献,提出一种新的自动标引方法,该方法基于文献之间的引用关系,利用被引文献的标引词,对遗传算法进行改进,实现自动标引,避免利用文献正文、标题等内部文本特征进行自动标引的局限性。通过在大规模真实测试集(中文学术文献)上进行实验,验证该方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号