首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 125 毫秒
1.
基于统计自然语言处理技术的领域本体半自动构建研究   总被引:1,自引:0,他引:1  
本体的构建是影响语义Web成功与否的重要因素之一.本文借鉴机器学习以及自然语言处理等技术成果尝试半自动构建本体,以专业研究论文为研究语料,采用N-Gram文本表达法从语料中抽取关键概念,计算主题度获取领域概念.利用改进的层次聚类算法对领域概念进行聚类以获取其等级体系,采用句法分析与统计相结合的方法从语料中获取可能的主、谓、宾模式为领域关系提供参考,并以农业史为例,设计开发了一个领域本体半自动构建实验系统,文中重点介绍了本体构建中概念的获取、等级关系、领域关系的构建以及形式化处理等关键技术的实现过程.  相似文献   

2.
实体关系抽取的技术方法综述*   总被引:3,自引:0,他引:3  
对实体关系抽取研究以MUC和ACE评测为主线的发展进行总结,并指出实体关系抽取任务普遍存在的三个问题是特定领域标引数据集的获取、模式的获取以及共指消解。在对当前关系抽取的相关文献、系统和项目进行分析研究的基础上,将基于非结构化文本的实体关系抽取技术方法归纳为:基于模式匹配的关系抽取、基于词典驱动的关系抽取、基于机器学习的关系抽取、基于Ontology的关系抽取以及混合抽取方法,旨在为进一步构建实体关系抽取系统提供良好借鉴。  相似文献   

3.
典型关系抽取系统的技术方法解析   总被引:3,自引:0,他引:3  
实体关系抽取是信息抽取领域中的一项重要任务.文章在对当前关系抽取的相关文献、系统和项目进行分析研究的基础上,将基于非结构化文本的实体关系抽取技术方法归纳为:以模式构造和匹配为主线进行关系抽取、以词典驱动关系抽取、运用机器学习算法进行关系抽取、借助Ontology进行关系抽取以及多种方法有机结合进行关系抽取.从技术应用特点、核心模块的实现细节以及系统评测结果等方面深入分析了典型的关系抽取系统,它们包括EEES关系抽取系统、SVM关系抽取系统、T-Rex关系抽取系统、KMI语义网络门户的混合关系抽取系统,旨在为进一步构建实体关系抽取系统提供良好借鉴.该文为2008年第9期本期话题"知识抽取"的文章之一.  相似文献   

4.
基于词形规则模板的术语层次关系抽取方法   总被引:1,自引:0,他引:1  
术语层次关系抽取是领域概念关系体系构建的重要基础.针对目前术语关系抽取中手工实现的问题,提出了基于词形规则模板匹配的术语层次关系抽取方法,实现从科技论文文本中抽取类属关系(IS-A)和整体部分关系(PART-OF)关系.利用复合术语的head和modifier特征,比较两个术语之间存在的边缘共用词汇,构造模板来确定它们之间的IS-A和PART-OF关系;提出泛化度指标,用于测量两个术语在概念层次树上的相对位置;提出相关度概念,用于测量两个术语之间在语义上的相关性.对不存在共用词汇和不匹配模板的术语采用泛化度差值和相关度来判断它们之间是否存在层次关系.实验从信息资源管理领域的论文文本中提取层次关系术语对1306对,准确率达到92.5%,证明提出的方法是有效的.  相似文献   

5.
基于学术文献构建领域本体对促进领域学科发展具有重要的意义。本文提出了一种以中文学术文献为数据源,半自动化抽取领域本体层次关系的框架方法。首先,构建了一个通用的领域本体层次关系的细粒度研究框架。其次,设计了一种新的概念表示方法,融合了深度学习方法得到的概念语义特征和上下文的时间序列词频。进一步结合了AP聚类、Prim算法和Web搜索引擎的查询数据,提出了基于规则推理的本体概念层次关系抽取算法(RROCHE),实现了半自动化概念层次关系抽取。最后,基于中文分词领域的中文学术文献数据,通过数值实验方法讨论了方法的可行性和有效性。本文提出的框架方法也非常容易推广并应用到各领域本体层次关系任务中。  相似文献   

6.
产业链知识图谱在金融领域应用较为广泛,但目前多数研究是面向单一产业的知识图谱构建或面向产业竞争情报服务,并没有把产业链和知识图谱有机地结合起来。本文从产业链应用角度出发,对产业链知识图谱的构建方法进行研究。首先提出了产业链知识图谱的构建流程和本体库,再基于领域语言模型,实现知识分类、抽取、融合等金融领域文本处理方法,对海量的领域文本进行知识抽取和融合,最终成功构建产业链知识图谱。根据本文方法构建的产业链知识图谱系统,覆盖产业链78个,细分行业7629个,已经应用到投融资、监管和产业规划等多个重要场景中。  相似文献   

7.
深度学习在自然语言处理方面取得了显著成效,为生物医学领域的信息抽取带来新的研究范式。本研究旨在系统调研生物医学语义关系抽取方法、分析其发展历程,为深度学习方法的进一步运用提供基础和启示。通过检索Pub Med、Web of Science和IEEE数据库,以及Bio Creative、Sem Eval等重要测评网站,遴选出具有代表性的抽取方法,并从目的、方法、数据集和效果四个维度进行分析。经过系统梳理,可将生物医学语义关系抽取方法分为三个阶段:基于知识、传统机器学习和深度学习。将先验知识和领域资源恰当地融入到深度学习模型中,是进一步提升语义关系抽取效果的探索方向。  相似文献   

8.
分析本体学习的内容,对本体学习的发展进行评述;对领域本体学习过程中的几个关键任务——领域概念抽取、概念关系的识别进行深入的分析;总结领域本体学习的发展趋势。  相似文献   

9.
为充分发挥知识组织在企业专利战略中的作用,在分析专利文献的基础上,根据中文专利文献句法描述的特点,利用最大串频匹配、蚁群聚类、多层KMeans聚类、改进关联规则计算、基于规则和CRFs的术语关系抽取等算法,设计出一套领域本体的半自动构建系统,包括术语抽取、分类关系抽取、非分类关系抽取、本体形式化等模块,初步实现结构化数据和非结构化文本的本体半自动构建。  相似文献   

10.
学科领域本体的构建与进化*-以经济学领域本体为例   总被引:7,自引:0,他引:7  
概述国内外领域本体构建方法及本体进化的研究现状;介绍以《中国分类主题词表》为基础构建“经济学领域本体”初始版本的基本过程,阐述经济学领域本体进化的基本设想,以及具体进化过程及方法,包括获取进化实验数据集,抽取候选关键词,获得本体新概念,建立概念关联等。  相似文献   

11.
对利用关键动词(即语义关系动词)进行关系抽取的研究进行回顾,并对生物医学语义关系抽取的常用方法进行详细介绍。认为目前关系抽取研究中所利用的关键动词主要是人工选取的,涉及的主观因素较多,影响关键动词选取的客观性、准确性和全面性。因此,如何自动化地找到这些动词可能会成为今后关系挖掘的一项关键任务。  相似文献   

12.
基于叙词表的领域本体构建研究   总被引:15,自引:2,他引:15  
论述了叙词表与领域本体(Domain Ontology)的区别与联系,讨论了基于叙词表构建领域本体的优越性,简要介绍了本体开发工具,最后提出了一种基于叙词表的领域本体构建方法,通过一个本体原型构建过程对该方法进行了详细阐述。  相似文献   

13.
[目的/意义]探索领域知识网络中的核心知识涌现有助于揭示知识发展的内在机理,对于掌握领域知识发展脉络以及发展模式具有重要意义。[方法/过程]以复杂网络的思想为基础,基于关键词的邻接关系构建领域知识网络。采用Hub涌现的分析方法,对领域知识网络从时间序列上进行动态跟踪与分析。从知识节点的度序列分布、熵值分析、特定节点涌现3个方面对领域知识网络的知识涌现现象进行分析。[结果/结论]研究结果表明:领域核心知识涌现过程中随机性与非随机性交互影响;领域核心知识涌现在总体上呈现由随机性主导到结构性主导的演进趋势;领域中涌现出的核心知识并非是一劳永逸一成不变的。  相似文献   

14.
根据本体构成的要素 --概念、概念间关系、公理,结合文本的非结构化特点,总结梳理当前从文本中自动获取领域本体概念及概念间关系的主要方法的思路、特征和适用范围,并运用两个实例解析面向文本的领域本体学习的具体步骤和实现过程。最后讨论存在的主要问题和进一步的研究方向。  相似文献   

15.
私人领域是与公共领域,尤其是与国家权力相对的活动空间。私人领域在不同时期的起伏变化,影响着同时代媒介文化的发展与特色。当今,媒介文化在私人领域彰显的情况下,呈现出私人化的特色。但媒介文化过度私人化则容易导致忽视公共性、侵犯他人隐私、流于媚俗等问题,这是值得警惕的。  相似文献   

16.
若要有效地实现文本分类,关键是对高维特征空间进行降维,降维方法分为特征选择和特征提取.本文对已有特征选择方法分析后发现,这些方法仅利用文档数来选择特征,没有考虑特征项的权重.为了找出本质特征,我们提出了一种基于特征项与类之间模糊关系的特征选择方法,引入特征项权重来确定其隶属度.采用KNN分类器,在Reuters-21578标准文本数据集上进行了训练和测试.实验表明,宏平均和微平均都达到了最高,分别为81.82%和94.88%,宏平均比IG,CHI提高了4.73%和1.12%,微平均比IG,CHI提高了1.56%和0.21%.  相似文献   

17.
近年来领域本体的应用新进展   总被引:2,自引:0,他引:2  
近年来,领域本体的发展非常迅速,不仅得到了广泛的应用,在实际应用中也取得了积极的作用。通过查找ISI、Elsevier等数据库查询到,近两年来国外文献中涉及的领域本体,包括化学领域、生物领域(分为基因领域和生物医学领域)、地理学领域和其他领域,并选取其中有代表性的领域本体并对其应用及进展进行分析研究,总结出领域本体应用进展的特点:涉及学科领域广;更加专业化、针对性更强;涉及多个学科的领域本体增多。领域本体的建设发展将有力推动数字图书馆的进步。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号