首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
从关键词链入手,结合形式概念分析技术,提出一种基于关键词链的动态分面方法。该方法首先采用作者关键词描述文献,然后基于相似度计算判断并合并语义上几乎一致的关键词,形成粗细不同粒度的形式背景,最后利用格技术构造搜索结果的语义分面。实证分析证明该方法可行、有效。  相似文献   

2.
在对文本分类技术和形式概念分析理论进行分析的基础上,针对医学领域文本的专业性特点,阐述利用形式概念分析进行医学领域文本分类的技术路线。通过中图法构建形式背景,进而生成概念格,利用概念格对领域文本进行分类,使分类效果接近人工分类。探索基于形式概念分析的医学领域文本分类的新途径。  相似文献   

3.
刘萍  王哲 《图书情报工作》2012,56(22):121-128
阐述作者关键词耦合和形式概念分析的基本原理,详细讨论在作者关键词耦合的基础上生成概念格的具体方法以及知识结构的建构过程。通过对该方法在某一科研组织中的应用举例,阐明该方法能够较好地揭示组织知识结构。与传统的共词分析方法相比,基于形式概念分析的作者关键词耦合分析方法层次化效果更清晰、人工干预程度更低。  相似文献   

4.
提出一种新的领域本体学习方法,结合形式概念分析(FCA)与关联规则挖掘从非结构化文本中获取情报学本体。该方法从文本集中通过种子-扩展机制的方法获取领域核心概念,构建文档概念格(文档×关键词矩阵),在此基础上通过形式概念分析方法来识别概念之间的等级关系,通过关联规则挖掘概念间的相关关系。最后,采用基于"黄金标准"的方法对本体学习的结果进行评价,结果表明:通过这种方法构建的本体可以达到较高的领域知识覆盖率,而且能够识别概念之间部分隐含的关系,从而验证该方法在领域本体的构建中实用且有效。  相似文献   

5.
本文基于术语共现理论,利用形式概念分析中概念格的自动生成来推理作为属性的领域专业术语的层次结构并进行可视化展示,进而提出了一整套用于实现领域本体概念层次关系构建的解决方案,具体包括文档/词汇与术语语义关联的识别、领域形式化背景的建立、基于形式概念分析的主题概念的生成、基于主题概念格的术语层次关系抽取、术语层次体系的OWL描述和图形展示等.笔者以“白血病”领域为例,详细论证了无知识库支持环境下中文文本到医学学科术语层次结构的衍化过程,并对以文档术语矩阵(DTM)和词汇术语矩阵(WTM)为形式化背景生成的术语层次体系进行了比较分析.  相似文献   

6.
通过对本体、形式概念分析理论研究状况进行分析,针对医学领域的专业性特点,利用形式概念分析构建形式概念背景,抽取概念,形成概念格;通过医学系统命名法-临床术语(SNOMED CT)的概念表、描述表和关系表对概念格进行修正,结合SNOMED CT和概念格构建医学领域本体--甲状腺疾病本体,并应用GATE利用所构建的甲状腺疾病本体对某三甲医院的电子病历进行语义标引,以验证本体的可用性.在此实验过程中同时根据所构建概念格提出对SNOMED CT表的修正建议.  相似文献   

7.
利用词语共现进行Ontology的概念获取   总被引:5,自引:0,他引:5  
作为大规模的语义知识资源库,Ontology在信息处理中具有重要的作用。但是,如何有效地构建Ontology却是一个重要的问题。对于自动构建Ontology的过程来说,首要的问题就是如何获取领域概念。本文尝试了一种利用词语共现获取领域概念的方法,用于支持领域Ontology的构建。该方法首先通过人工领域分析,获得起始领域概念,然后利用起始概念从语料库中抽取共现的概念,从而获取相关的概念知识。同时,本文以1998年1月份的人民日报语料库为语料,针对外交和体育两个领域,尝试从中提取相关的概念,从而检验利用词语共现获取领域概念的实际效果。  相似文献   

8.
以CNKI真实数据集为研究对象,通过共引文献统计功能得出一个文献耦合网络。首先采用形式概念分析的方法构建耦合文献形式背景,其次对耦合网络中的知识载体与知识属性剥离解析,而后探寻知识概念的偏序关系,进而建立耦合文献概念格。经由知识聚类、关联规则挖掘等一系列格上作业,可视化地勾勒出文献耦合网络的知识结构以及知识属性之间的组分异质性规律,探索概念格技术与引文分析方法的融合机制。  相似文献   

9.
提出一种改进的基于相似度计算的科技文献关键词选取算法。先利用N-gram算法提取领域词库,再综合利用领域词库和常识词库,对最初选择的关键词重新切分,进行给定关键词之间的语义对比。语义相似度大于一定阈值的关键词被认为是表达同一意义的同义词,将同义词在文献库中合并,从而解决关键词冗余问题。实验结果可以证明该方法的有效性。  相似文献   

10.
基于2005—2009年国内数字图书馆管理研究领域相关文献的计量分析,对数字图书馆管理体系5年间研究的总体情况、核心期刊发文量、热门关键词分布情况以及核心概念网络的分布情况进行统计分析。同时,采用社会网络分析和计量分析的方法,定义了领域关键词的专属度指标,并计算了国内数字图书馆管理研究领域的向心度指标。  相似文献   

11.
文献特征共现分析可以揭示文献的内容关联和特征项隐含的寓意.基于2-模网络模型探讨不同特征共现的分析方法,有利于挖掘不同特征共现网络的深层次结构关系.通过构建2-模网络模型及其测度指标,从多角度揭示某领域的科研单位和关键词在本领域的地位和影响.以应急管理领域的发文活跃单位及其采用的高频关键词为例,共现网络实证分析表明:科研单位的发文数量是体现其学术能力、学术地位和媒介作用的重要指标,但并非发文数量越多影响越大;关键词的频次是衡量其表征研究热点的能力、重要程度和媒介作用的重要指标,但并非频次越高影响越显著.  相似文献   

12.
基于2005—2009年国内数字图书馆评价体系研究领域相关文献的计量分析,对数字图书馆评价领域5年间研究的总体情况、核心期刊发文量、热门关键词分布情况以及核心概念网络的分布情况进行统计分析。同时,采用社会网络分析和计量分析的方法,定义了领域关键词的专属度指标,并计算了国内数字图书馆评价体系研究领域的向心度指标。  相似文献   

13.
本文以"非典型肺炎"和"甲型H1N1流感"两个传染病作为研究样本,以中国知网(CNKI)数据库中的文献关键词作为语料库来源,基于用户关键词词频统计,并结合人工核查,分析同一概念的同义词和近义词以确立关键词词间的等同关系。目的是了解用户关键词和MeSH主题词之间的差异,分析用户表达偏好和习惯,进而为叙词表维护中的候选词汇选择提供一定的参考。  相似文献   

14.
[目的/意义]传统的关键词自动抽取将摘要看成一个整体,常以候选词的出现频次等非语义信息构建特征,并未考虑学术文献摘要中目的、方法、结论等各个结构功能语义蕴含的差异性。本文以中文文献为研究对象,探讨候选词所在的结构功能域对关键词抽取的影响和作用。[方法/过程]本文将文献标题和摘要文本共分为4个结构功能域,在传统的词频、词长、词跨度等基准特征上,融合了基于BERT的语义特征和结构功能特征,并以不同的特征组合方式,使用图书情报领域的中文学术文献,基于分类模型进行关键词自动抽取实验。[结果/结论]实验结果表明,融合结构功能特征后,关键词抽取效果整体提升了6.82%,证明了学术文献摘要结构功能的识别形成的结构功能特征对关键词抽取效果的提升有良好作用。  相似文献   

15.
运用多种关键词分析方法,对1 965年以来档案局(馆)人员编制、内设机构与职能配置相关文献中指定关键词进行分析,得出:研究者对不同指定关键词的关注程度不同;不同类型机构对同一关键词的关注度亦有差别;同一类型机构对与自身相关内容的关注度高;高校对整个内容的关注度较为均衡;关键词组合在文献中出现的概率与关键词的数量成反比;相关关键词混用的情况普遍.  相似文献   

16.
针对传统信息检索模型不能很好满足用户需求的问题,在分析现有相关研究的基础上,提出基于领域Ontology的知识检索模型。通过构建领域Ontology,对文档进行语义标注,对查询请求进行概念提取和语义扩展,从而得到语义索引项作为文档和用户请求的知识表达,进一步研究领域Ontology中词语间语义关系的计算模型。考虑到语义相似度与语义相关的内在关系,给出相关系数来衡量检索目标与候选者间符合程度。最后对提出的模型进行验证,结果表明检索性能有显著提高。  相似文献   

17.
基于概念格的异构资源领域本体构建研究   总被引:1,自引:0,他引:1  
在对本体构建研究路径进行分析的基础上,阐述以概念格构建异构资源领域本体的内在机理和技术路线。通过概念格的并叠置运算,获得基于主题词表和文本两大异构资源的概念格。进而以异构资源概念格构建异构资源领域本体,并对异构资源领域本体的构建进行讨论。为数字图书馆构建异构资源领域本体做出探索。  相似文献   

18.
[目的/意义]潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)在科技情报分析中用来发现学科主题、挖掘研究热点以及预测研究趋势等。对常见的科学文献文本语料库(关键词、摘要、关键词+摘要)进行LDA主题抽取效果的评价,以揭示不同语料库的主题抽取效果,提高LDA在科技情报分析中的应用效果。[方法/过程]对上述3种语料库下的LDA主题模型进行对比研究,采用基于查全率、查准率、F值以及信息熵的定量分析和基于主题抽取的广度和主题粒度的定性分析相结合的方法对主题抽取效果进行评价。[结果/结论]通过国内风能领域的科学文献数据实证研究发现,无论是从定量分析还是从定性分析来看,摘要和关键词+摘要作为语料的LDA主题抽取的效果均优于关键词作为语料的LDA主题抽取效果,并且前者在主题抽取的广度方面表现更好,而后者抽取的主题粒度更细。  相似文献   

19.
基于2005-2009年国内数字图书馆资源建设和资源组织研究领域相关文献的计量分析,对数字图书馆资源领域近5年研究的总体情况、核心期刊发文量、热门关键词分布情况以及核心概念网络的分布情况进行统计分析。同时,采用社会网络分析和计量分析的方法,定义了领域关键词的专属度指标,并计算了国内数字图书馆资源建设和资源组织研究领域的向心度指标。  相似文献   

20.
新闻研究具有丰富的历史,每个时期呈现出不同的研究热点。本文借助文献分析软件Cite Space,以关键词图谱为基础,对近三年(2014-2016年)知网数据库(CSSCI)中新闻研究的共2886篇期刊文献,进行了研究热点和前沿领域分析,展示近三年来我国新闻研究的前沿重点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号