首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 203 毫秒
1.
领域本体的半自动构建方法研究   总被引:2,自引:0,他引:2  
人机协作的半自动构建本体是目前较为理想的模式。借鉴软件工程中的领域建模、图书馆学中的分类学和本体学习的方法论,由领域专家给出领域的上层知识模式,通过机器学习技术从领域语料库中学习等级关系和相关关系为知识工程师提供参考,将专家的自顶向下和机器学习的自底向上的结果结合起来构建本体。半自动构建领域本体的关键技术在于领域概念的获取和组织,用共现统计算法、关联规则算法、隐含语义索引、Hopfield联想算法获取相关关系,用聚类算法、字面成族、模式匹配获取等级关系,从而完成领域类模型的构建。  相似文献   

2.
中医药本体构建研究   总被引:5,自引:0,他引:5  
利用自然语言处理(NLP)理论和技术方法对中医药领域中已有的公认领域知识进行了重构与利用,在成功实现了中医药学知识描述体系的自动构建与获取的基础上,利用领域专家知识,实现了受限文本的Ontology自学习机制,并对领域本体的进化进行了有益的探索,有效地解决了Ontology研究的瓶颈问题,从而为中医药知识的挖掘与利用奠定了数据基础。从目前看来,这是一种较为理想、实用的方法,为专业领域Ontology的自动构建提供了理论依据及技术支持。  相似文献   

3.
面向双语术语抽取这一应用目标,提出专业领域可比语料库的构建方案并进行实验论证。针对给定的主题领域分别进行中英文专业语料的采集,从中分别获取中英文关键词,根据词语共现统计获取该主题领域的其他相关关键词;以这些关键词作为查询入口,通过学术搜索引擎从网络获取候选可比语料;对可比语料进行定量评估,以剔除不符合要求的语料,最终得到特定主题领域的可比语料库。  相似文献   

4.
针对传统信息检索模型不能很好满足用户需求的问题,在分析现有相关研究的基础上,提出基于领域Ontology的知识检索模型。通过构建领域Ontology,对文档进行语义标注,对查询请求进行概念提取和语义扩展,从而得到语义索引项作为文档和用户请求的知识表达,进一步研究领域Ontology中词语间语义关系的计算模型。考虑到语义相似度与语义相关的内在关系,给出相关系数来衡量检索目标与候选者间符合程度。最后对提出的模型进行验证,结果表明检索性能有显著提高。  相似文献   

5.
Ontology在数字图书馆领域中的应用与研究综述   总被引:2,自引:0,他引:2  
刘颖  詹萌 《图书馆杂志》2005,24(6):53-58
Ontology作为一种能在语义和知识层次上描述概念体系的有效工具,是知识工程及其相关领域的研究热点之一,在数字图书馆领域也得到了相当广泛的关注。本文简要介绍了OntologY在数字图书馆领域的研究和应用现状,包括Ontology与叙词表、分类法、知识库、元数据的关系,Ontology构建方法以及Ontology在数字图书馆领域的应用等。  相似文献   

6.
以概念格理论为基础,在形式概念分析的基础上,提出以粒度概念分析(GCA)的方法进行文献关键词分析,并针对Ontology领域开放存取文献的关键词,构建不同粒度概念格。通过基于粗细不同粒度概念格的挖掘,对Ontology领域相关文献进行领域高频关键词和相关低频关键词的分析,从而揭示和呈现Ontology领域相关知识的结构和内在关联,以期探索一种基于概念格的文献关键词分析的新途径。  相似文献   

7.
Ontology技术在知识服务中的应用   总被引:3,自引:0,他引:3  
在利用RDF和OWL获取本体元信息的基础上,结合Ontology的分析,探讨了构建概念、语义检索系统的方法,从而实现电子文本知识的挖掘.  相似文献   

8.
共现分析在知识服务中的应用研究   总被引:16,自引:1,他引:16  
在论证共现分析内涵、方法论和流程的基础上,探索研究共现分析在知识服务方面的应用,具体阐述共现分析在构建概念空间和Ontology实现语义检索、改进知识组织中文本分类效果、分析文献中知识内容关联、挖掘知识价值的应用。  相似文献   

9.
本体技术可以有效的解决各种异构信息的转换和集成问题,但是现阶段人们却缺乏有效的自动本体构建方法.本文根据现有的图情专业学术文献数据库,提出一种利用引文关键词共现技术的领域本体自动构建方法.该方法利用引文分析思想来计算文献的学术价值,并以此来计算文献和引用文献的词语共现对权重值,完成了本体结构中层次概念联系的表达和设计,同时还利用基于加权词语共现对序列相似度的算法实现了同义概念联系的抽取.最后,本文就相关实验及其结论做了详细的说明.  相似文献   

10.
汉语框架网络知识本体构建研究   总被引:2,自引:0,他引:2       下载免费PDF全文
汉语框架网络知识本体是以框架语义学为理论基础,有丰富的语料库支撑,揭示了概念的本体关系。其获取,是在构建语料库的基础上,利用叙词表、分类表和其他知识分类体系等现有的知识本体,识别领域内外相关的概念并抽取相应属性,建立概念之间的关系,并利用所识别的概念和关系创建新的本体,融合已有的本体和新建本体。图2。参考文献4。  相似文献   

11.
中医药本体概念描述体系的自动构建研究   总被引:3,自引:0,他引:3  
对中医药本体概念描述体系自动构建所需要的数据基础进行深入研究,在全面阐述数据加工方法及技术的基础上,利用自然语言处理(NLP)理论与方法对中医药领域中已有的公认领域知识进行重构与利用。成功实现中医药学知识描述体系的自动构建与获取,从而为中医药知识的挖掘与发现、利用奠定数据基础,并对领域本体的构建与进化进行有益的探索,为专业领域本体的自动构建提供理论依据及技术支持。  相似文献   

12.
实体关系抽取的技术方法综述*   总被引:3,自引:0,他引:3  
对实体关系抽取研究以MUC和ACE评测为主线的发展进行总结,并指出实体关系抽取任务普遍存在的三个问题是特定领域标引数据集的获取、模式的获取以及共指消解。在对当前关系抽取的相关文献、系统和项目进行分析研究的基础上,将基于非结构化文本的实体关系抽取技术方法归纳为:基于模式匹配的关系抽取、基于词典驱动的关系抽取、基于机器学习的关系抽取、基于Ontology的关系抽取以及混合抽取方法,旨在为进一步构建实体关系抽取系统提供良好借鉴。  相似文献   

13.
不借助于任何辞典工具而从Web中自动挖掘出术语的翻译,这是一项有趣且富有挑战性的工作.本文提供了一种基于部分平行Web语料的自动术语翻译方法.首先通过一个术语对,采用Web挖掘技术,获取潜在的匹配模式.接着,在用户对源术语进行翻译时,利用已获取的模式来抽取候选答案集,最后依据评分函数,对候选答案进行排序,并将结果以格式化的形式反馈给用户.本文依据三条层次规则,构造了候选答案的评分函数.实验结果表明,本文所构造的评分函数客观反映了不同匹配模式的不同重要性,且基于部分平行Web语料的方法能够很好地发现源术语的正确翻译,优于现有的技术方案.  相似文献   

14.
基于本体构建的协同推荐研究   总被引:2,自引:0,他引:2  
通过构建领域本体,利用用户兴趣与领域本体中概念的映射关系,构建用户兴趣本体,发掘用户兴趣模式。研究用户兴趣本体相似度的计算方法,并通过用户兴趣相似度进行垂直加权,通过时间新颖度进行水平加权,从而利用改进的加权关联规则挖掘算法对用户感兴趣的领域本体中的概念进行挖掘,实现面向内容的协同推荐。  相似文献   

15.
学术资源本体非等级关系抽取研究   总被引:1,自引:1,他引:0  
蒋婷  孙建军 《图书情报工作》2016,60(20):112-122
[目的/意义] 概念非等级关系抽取是本体构建的必要步骤,学术文献作为一种重要的学术资源类型,本文主要利用其结构特点来进行本体概念非等级关系的抽取。[方法/过程] 首先,在本体概念抽取的基础上,对文献中概念的类型进行分类,以便于后期关系动词搭配的概念类型来排除不符合条件的三元组;其次,确定学术文献中的关系类型,并采用C-value方法抽取表示关系的动词,进行本体关系的表示;再次,评价概念对的关联性,利用互信息法对概念对进行排序并去除非相关概念对,实验表明该方法非常有效;最后评价概念对与关系动词的关联,分析影响三元组关联的因素,再采用实验确定模型挖掘三元组,实验比较现有的关联规则挖掘的方法。[结果/结论] 结果表明本文提出的三元组选择模型效果明显超过现有的关联规则挖掘方法,并且在语料集扩大的情况下这种优势更为明显。  相似文献   

16.
提出一种新的领域本体学习方法,结合形式概念分析(FCA)与关联规则挖掘从非结构化文本中获取情报学本体。该方法从文本集中通过种子-扩展机制的方法获取领域核心概念,构建文档概念格(文档×关键词矩阵),在此基础上通过形式概念分析方法来识别概念之间的等级关系,通过关联规则挖掘概念间的相关关系。最后,采用基于"黄金标准"的方法对本体学习的结果进行评价,结果表明:通过这种方法构建的本体可以达到较高的领域知识覆盖率,而且能够识别概念之间部分隐含的关系,从而验证该方法在领域本体的构建中实用且有效。  相似文献   

17.
采用语义分析、系统开发等方法,论述构建领域本体的复杂性,提出利用本体中概念具有的“领域属性”来表示和构建领域本体的观点。并举实例说明在基于农业初级本体的文献检索系统中利用概念的领域属性达到了排除岐义的效果。  相似文献   

18.
面向语义Web的智能数字图书馆的实现很大程度上依赖于本体的建立,本体与数字图书馆中的数字资源采集、数字馆藏和用户访问网关都密切相关。在本体构建方面,目前存在的绝大多数本体都是手工生成的,该方法效率低、出错率高,更难以维护和更新。这对语义级数字图书馆的实现造成了巨大的障碍。为此提出了一种面向数字图书馆的本体学习方法GOLF,通过对各专业领域中大量的Web文档集和语料库进行挖掘来实现本体学习,并分别讨论了本体学习中本体概念的抽取、概念之间语义关系的抽取和分类体系的自动构建等关键技术。  相似文献   

19.
一种基于词共现图的文档自动摘要研究   总被引:1,自引:0,他引:1  
耿焕同  蔡庆生  赵鹏  于琨 《情报学报》2005,24(6):651-656
本文提出了一种基于词共现图的文档自动摘要算法。该算法以统计方法为基础,又利用词共现图形成的主题信息以及不同主题间的连接特征信息,旨在能够有效地生成既全面反映文档的主要内容,又不受领域限制的文档摘要;同时该方法能动态地确定文档摘要长度。在实验评估中,该文档自动摘要方法取得了令人满意的摘要效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号