首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 265 毫秒
1.
张晗  赵玉虹 《图书情报工作》2016,60(11):135-142
[目的/意义]针对共词分析存在的普遍问题,提出一种基于细粒度语义分析的共词网络构建与分析方法。[方法/过程]借助SemRep实现源文本主题概念及其语义关系的规范化抽取并由此构建语义共词网络,然后以节点的中心度和边的频次为指标对内容特征词进行抽取,利用UMLS语义网络规定的语义搭配模式,通过概念-语义类型-语义类型组的两级映射,对语义述谓项进行类团划分。[结果/结论]通过与常规共词分析方法比较,发现基于细粒度语义关系的共词分析能有效地揭示文本主题内容,利用UMLS语义网络资源能从语义学角度清晰准确地对语义共词网络进行类团划分。  相似文献   

2.
赵一鸣  尹嘉颖 《情报学报》2023,(10):1187-1198
共词网络是研究语言现象的重要方法,语义特征是词汇共现现象中重要的隐性知识,研究共现词之间的语义关系及特征,可以从语义视角改进共词网络的研究,并利用语义学知识为现有的共词分析方法赋能。本文提出了一种语义增强型的共词网络构建和分析方法,从共现特征、网络特征与语义特征3个维度丰富了共词网络节点和边的属性。通过实验构建了基于14万余篇新闻文本数据的语义增强型全文本共词网络,并重点对共现词对的语义特征进行分析,结合案例呈现了该方法在计算语言学研究和行业应用上的价值。本文从词间语义关系的视角,拓展了共词网络的构建和分析方法,描述了共现词汇的语义特征,证实了语义关系的非对称性和传递性,为语义关系的分类与推导提供了理论依据,在语义消歧、词义理解等方面具有应用价值。  相似文献   

3.
为深入理解图书情报学学术论文中所使用的研究方法的语义功能,为用户提供基于知识单元的细粒度知识服务,文章首先基于体裁理论来分析引文分析法、田野研究法、共词分析法、实验法、比较分析法和问卷调查法的知识单元构成。其次采用文本分析法,检索CSSCI图书情报学领域的18种期刊中使用以上6种研究方法的论文,进行知识单元层次的深度标引,作为知识库构建的语料。再次采用系统设计法,开发具有4种功能的学术论文研究方法学习系统。最后采用实验法,招募30位研究生使用系统,并根据用户体验对其可用性进行评价。结果表明:研究方法的体裁分析能较好地表示使用该方法开展研究的论文的语义功能,解释研究方法使用过程各部分的语义特征,为深入到知识单元层面的标引提供了基础,也为用户提供了基于知识单元的细粒度的检索点,知识库具有很好的可用性。文章揭示了论文研究方法使用过程各部分的语义特征,基于知识单元构成而设计的学术论文研究方法知识库能有效帮助用户学习研究方法,为学术论文研究方法内容的深度语义标引和本体开发奠定了基础,也为用户提供细粒度、多维度的论文研究方法内容的检索服务,对面向知识发现的知识组织研究具有参考意义。  相似文献   

4.
面向网络信息资源聚合搜索的细粒度聚合单元元数据研究   总被引:1,自引:0,他引:1  
由于相关信息片段分散分布在海量且复杂多样的网络信息资源中,用户往往需要花费大量时间浏览、查询和收集所需信息。面向聚合搜索的细粒度聚合单元元数据可以深入揭示信息特征及其关联关系,促进知识发现并提升知识服务效率。因此,有必要构建细粒度聚合单元的元数据描述框架。本文以图书情报领域开放获取期刊论文、在线百科、博客等网络信息资源为数据源,采用逻辑结构分析和形式结构分析方法建立聚合单元划分框架,包括篇章层级的标题、著者等外部特征,以及节段、句群、图表单元中的话语意图和语义功能等特征;通过分析聚合单元的属性特征及复用DC、LOM元数据元素,构建描述聚合单元访问信息、物理信息和语义信息的元数据框架;设计检索数据库并采用实验法对聚合单元元数据框架进行验证。实验表明,该元数据框架可支持多类型网络信息资源、各层级细粒度聚合单元的检索,可为细粒度信息聚合与搜索提供理论基础与实践指导。图7。表6。参考文献58。  相似文献   

5.
为完善和优化共词分析方法,本文从共词分析过程中概念术语的词源选择、高频词的选定、术语相关性计算以及多元统计分析四个方面系统地总结共词分析存在的局限性。在词源选择方面,论述不同类型的文献分析单元、术语的规范化以及术语表征差异性对共词分析的影响;在高频词选定方面,分析国内外相关研究在设定高频词阈值、考虑术语语义类型特征以及低频  相似文献   

6.
本文首先提出了一种三词共现分析方法,介绍了它的基本结构和特点,并据此提出了三词有序共现对的概念,同时还说明了获取映入词和紧密环的方法.然后,文章重点阐述了如何利用该三词共现分析方法来识别学者主要的研究兴趣特征.在上述研究的基础上,文章随后介绍了一种个性化外文推荐服务的实现方法,对其中外文文献数据的收集处理、规范处理及其推荐策略都进行了详细说明.最后,文章对相关测试实验及其改进效果做了必要的说明.  相似文献   

7.
客观知识体系中语义关系相邻共现规律研究   总被引:1,自引:1,他引:0  
客观知识体系是由概念为节点和语义关系为边组成的大规模语义网络,其中普遍存在着大量的语义关系相邻共现现象,却一直未引起学者的关注.本文针对语义关系相邻共现现象进行了定义与分析,并根据语义关系共现的特点和基于前人的共现分析方法,选择了语义关系相邻共现强度函数,并以WordNet为背景计算其语义关系相邻共现矩阵.通过分析该共现矩阵发现了单个语义关系间的共现规律,并依据语义关系分类进一步挖掘了一类语义关系与其他关系间的共现规律.这些语义关系相邻共现规律的发现为判断语义关系组合的可能性和有效性提供了客观依据,为研究语义关系组合打下了很好的基础.  相似文献   

8.
在当前词共现分析多关注两词共现分析的基础上,提出多词共现分析方法,并采用关联规则挖掘中的频繁项集抽取法,实现多词共现的抽取和与分析.以我国国家知识产权局专利数据库(SIPOD)中数字信息的传输领域(H04L)为例,抽取和深入分析该领域中词最多的多词集合和频数最大的多词集合.最后,结合当前文献计量学中研究热点的定义与识别,应用多词共现分析方法发现H04L领域中的6个研究热点,进而对这6个研究热点中的部分代表性专利文献进行介绍.  相似文献   

9.
随着书目资源中多源异构数据的增多,信息片段呈现出扩散分布的特征,这增加了用户获取目标资源的难度、降低了信息检索效率,而聚合细粒度信息资源、构建信息单元之间的关联关系对于知识服务效率的提升具有重要作用。本文通过对聚合单元进行细粒度划分,根据语篇单元、句群单元、节段单元的属性特征及DC、LOM元数据,构建了细粒度聚合单元元数据框架;从聚合单元知识组织体系出发,结合细粒度聚合环境下聚合单元之间的关联关系,构建了基于聚合单元元数据框架的细粒度信息语义组织模型,并基于该模型提出书目关系扩展及映射方案;通过分析聚合单元元数据框架下的书目数据聚合层次及其他书目框架实体之间的关联,实现了书目元数据细粒度与揭示内容的细化、扩展,为细粒度书目资源聚合及检索提供了理论基础。图7。表4。参考文献23。  相似文献   

10.
共词分析是一种有效地文献内容分析方法,已经在各种情报研究工作中得到了广泛的应用.共词分析方法本身也在应用过程不断被改进和发展,但是目前共词分析研究主要关注二元词对共现的研究,对三元甚至多元词组的共现很少涉及.研究参考国内外共词分析研究成果,借鉴DLG关联挖掘算法,提出基于位向量的三元共词分析算法和基于坐标图的三元共词结果分析方法.并以国内知识发现研究的期刊论文关键词为对象进行三元共词分析实证研究,发现三元共词结果具有一定的实际意义,三元共词分析有一定的应用价值.  相似文献   

11.
细粒度的视频档案资源语义关联聚合是视频档案资源精准化、知识化服务实现的基础。本文在分析当前我国视频档案资源聚合工作面临的主要问题的基础上,结合视频档案资源的特性,提出了基于视频单元的视频档案资源多维语义关联聚合思想,并界定了视频单元概念,阐释了基于视频单元的视频档案资源多维语义关联聚合含义与实现逻辑,设计了多维语义关联聚合实现框架。文章最后还从视频档案资源内容特征提取、语义关系优化、关联链接维护以及服务应用推进等层面提出了具体实现保障策略。  相似文献   

12.
网络环境下共词分析方法的应用研究   总被引:5,自引:0,他引:5  
共词分析方法是图书情报研究中的一种十分有效的研究方法,在网络环境下其应用更加深入.本文利用SPSS11.0统计分析软件的因子分析、聚类分析以及多维尺度分析对1997-2007年间国外网络计量学的62篇研究论文进行了共词分析,验证了当前国外网络计量学的主要研究内容并进一步得出了未来的研究热点是链接分析和网络引文分析两个方面,充分显示了共词分析在解释学科研究主题方面的重要作用.  相似文献   

13.
[目的/意义] 基于高维矩阵稀疏降维的思想,提出一种利用惩罚性矩阵分解(Penalized Matrix Decomposition,PMD)实现共词分析的新方法。[方法/过程] 以"学科服务"为研究主题,根据PMD算法原理,在Matlab环境下分别实现特征词的提取、特征词的软聚类以及聚类效果的可视化。[结果/结论] 与传统的共词分析方法对比,PMD算法在共词分析中具有独特的优势:提取的特征词比较全面,聚类数目便于确定,聚类结果易于理解。  相似文献   

14.
基于共词分析法的学科主题演化研究方法的构建   总被引:1,自引:0,他引:1  
唐果媛 《图书情报工作》2017,61(23):100-107
[目的/意义]相比于以单纯的关键词统计排序为主的词频分析法,和以文献作为分析对象、需要庞大的引文索引作为基础的共引分析法,共词分析法具有一定的优势。因此,基于共词分析法来研究学科主题演化规律。[方法/过程]构建基于共词分析法的学科主题演化研究方法,包括4个模块,分别是:数据准备、演化阶段划分、主题识别和主题演化分析。[结果/结论]在主题识别阶段改进了词频g指数来选取共词分析的对象;在主题演化分析模块,提出从静态和动态两个角度来分析学科主题的演化情况,构建三维战略坐标来进行静态分析,并构建学科主题演化现象识别模型来进行动态分析。  相似文献   

15.
基于知识元的科技文本内容描述框架研究   总被引:1,自引:0,他引:1  
[目的/意义] 从细粒度角度深化科技文本的内容语义描述,弥补目前文本知识对象特征描述粒度较粗且缺乏语义的不足,为知识重组与挖掘,提供精细化的用户知识服务给予一种思路。[方法/过程] 以知识元理论为基础,通过对科技文本内部属性的语义分析,尝试构建细粒度的科技文本内容描述框架,给出两个实例并讨论。[结果/结论] 该内容描述框架实现了检索结果从海量的文献单元聚焦到精准化的知识元的转变。  相似文献   

16.
基于论文属性的加权共词模型探讨   总被引:2,自引:0,他引:2  
本文在分析共词研究现状的基础上,对论文属性在分析中的影响、作用进行了探讨,发现目前共词分析方法中没有考虑论文属性对共词分析所产生的影响问题,进而构建基于论文属性的加权共词分析模型.模型构建之后,利用加权后的Jaccard系数来计算关键词之间的距离.在案例分析部分,作者将被引次数作为论文属性的综合衡量指标代表来具体实现文中所讨论的加权共词模型,并从网络上下载了数据,对数据进行共词分析和加权共词分析,并对二者的分析结果进行了对比分析,验证了加权共词模型的可行性.文章的最后,提出了加权共词模型需要进一步研究的问题.  相似文献   

17.
[目的/意义]大数据环境下,用户的知识需求由分散向关联转变,利用多特征耦合可以辅助知识发现服务发现资源间的多种相关关系,从而优化知识发现服务。[方法/过程]通过分析文献内部和外部属性特征定义多特征耦合的概念,从功能角度出发,剖析多特征耦合与数字图书馆知识服务之间的关系,结合现有的知识发现系统构建多特征耦合架构,基于数据层-耦合层-服务层三层提出提升知识发现服务供给侧的方法。[结果/结论]数据层保障数据的质量,数据源由单一向混合转变;耦合层提升耦合分析效果,分析单位由粗向细转变,注重细粒度单元间的语义关联;服务层重视用户的交互体验,开发多维可视化功能。  相似文献   

18.
[目的/意义]分析学科主题演化趋势,对科研人员研究学科知识、决策层规划学科布局都有重要意义.相比于词频分析法和共引分析法,共词分析法的优势是能深入文献内部,从微观角度揭示学科主题演化规律.分析中国国内基于共词分析法的学科主题演化研究现状,以期为相关研究人员提供参考和借鉴.[方法/过程]采用人工判读法提炼出基于共词分析法的学科主题演化研究分析流程的5个步骤,并对每个步骤中研究人员使用的策略、分析手段和工具进行归纳总结.[结果/结论]数据集的来源数据库主要有综合类、专门类和引文类等3种,检索策略有基于词、基于期刊和复合检索策略等3种;共词分析对象来源主要为作者关键词,关键词选取主要基于关键词词频、关键词共现词频和前两者相结合3个角度;构建共词矩阵时使用得最多的归一化系数为ochiai系数;最常用的主题演化分析手段为聚类分析和社会网络分析图谱;使用得最频繁的工具为SPSS软件.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号