首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 171 毫秒
1.
基于共现分析的文本知识挖掘方法研究   总被引:1,自引:1,他引:1  
从应用出发,在综合已有研究成果基础上,分析共现分析在文本知识挖掘中的主要作用,提出基于空间分布、时间分布和内外关联的文本知识挖掘的三种应用思路,研究利用共现分析挖掘文本知识的一般应用流程,并分析适用对象范围、适用的研究目标及应用的优缺点。  相似文献   

2.
共现分析在知识服务中的应用研究   总被引:16,自引:1,他引:16  
在论证共现分析内涵、方法论和流程的基础上,探索研究共现分析在知识服务方面的应用,具体阐述共现分析在构建概念空间和Ontology实现语义检索、改进知识组织中文本分类效果、分析文献中知识内容关联、挖掘知识价值的应用。  相似文献   

3.
数智时代,面对大数据、大知识所带来的挑战,如何创新发展信息分析方法,关乎新时代信息分析工作的开展,关乎数据资源的开发利用。本文在梳理现有信息分析方法的基础上,提出数据驱动、知识驱动,以及数据与知识融合驱动的三种数智型方法思路。首先,提出基于文本、网络、音频、图像等的数据驱动以及与之相应的文本挖掘、图挖掘、音频挖掘、图像挖掘等信息分析模式;其次,提出基于专家知识库、通用知识库、领域知识图谱、通用知识图谱等的知识驱动信息分析模式;最后,提出基于特征、模型、决策三种层面的数据与知识融合驱动的信息分析模式。通过以上三种方法,构建能够系统融合大数据、大知识的信息分析方法,实现数智融合型信息分析,促进图书情报学科方法论发展,赋能国家决策和社会治理。图3。表1。参考文献59。  相似文献   

4.
面对网络中日益丰富的文本性情感信息资源,利用关联挖掘技术对其进行智能化的自动挖掘与分析,获取语义层面的用户情感知识,对于企业竞争策略的制定和竞争优势的保持具有重要的潜在价值。将关联挖掘技术融入文本情感分析之中,研究并设计一种融合语义关联挖掘的文本情感分析算法,实现语义层面的情感分析与用户情感知识挖掘。实验结果表明,该算法取得了很好的预期效果,显著提高了情感分析的准确率与效率以及关联挖掘的深度与广度。  相似文献   

5.
[目的/意义]科技文献中各种特征项及其之间的关联是构成多种多样共现现象的基本单元,通过挖掘共现特征项之间的关联,共现分析可以从不同角度探测科学与技术活动规律的方方面面,为科研管理者和研究者等提供一个全方位、多角度观察科学发展的新视角。[方法/过程]通过对多重共现的基础理论研究,构建一套独特的多重共现数据模型基础理论体系,该理论体系包括:多重共现的定义、多重共现的研究范畴、用于多重共现的变量符号、多重共现的矩阵定义、多重共现的数据组织形式以及多重共现的延展系数计算公式与应用范畴。此外,基于多重共现的交叉图可视化方式,构建可用于分析3个或以上特征项共现关系的知识发现方法,包括共现关联强度、被引关联强度以及共现突发强度的分析方法。[结果/结论]通过该基础理论体系的构建,拓展共现现象的研究范围,为共现分析走向多角度、多维度的多重共现分析提供基础理论的支持。并通过实证研究,选取不同的多重共现应用案例,证明该方法可应用于研究领域、研究机构、机构间对比、研究学者等方面的分析,同时具有较好的分析效果。由于该方法体系具有分析角度多维化和分析方法多样化的特点,通过该方法的分析,除能够实现一重、二重共现等的分析效果外,还能揭示出比一般共现更为广泛和深入的知识内容。  相似文献   

6.
整合中文维基语义的网络论坛话题追踪方法研究   总被引:1,自引:0,他引:1  
研究中文维基语义图上的网络论坛话题追踪,对于提高舆情分析系统获取情报的效率及信息处理质量有很大价值.以涉军主题帖子为背景,借鉴维基百科语义相关度与词语共现关系,构建反映词语间静态与动态关联的文本概念图,改进PR算法的关键词挖掘方法,利用维基知识解决论坛文本中的语义特征稀疏问题,减少噪音以提高论坛文本语义相关度计算的准确性.最后实验证明该方法的优越性.  相似文献   

7.
庞弘燊 《图书情报工作》2015,59(24):115-122
[目的/意义]基于科技论文多特征项共现突发强度的分析方法研究是将各学科领域科技论文文献载体中的多特征项共现信息定量化、重点热点突发的信息内容可视化的知识图谱分析方法。从动态论文等文献的文档流中探测出突发的特征项对识别密集的内容、活跃的特征项以及预测文本内容的发展走势具有重要的意义。[方法/过程]本研究针对科技论文多特征项共现的突发监测问题,对比目前已有的突发监测分析算法,将改进后的基于卡方统计的热点词计算方法进一步应用于本研究所设计的多特征项突发共现分析方法,并自主开发多特征项突发共现可视化分析工具,用于科技论文多特征项突发共现的图谱可视化,以期通过该研究来揭示相关科技文献的变化状况及突发的热点内容。[结果/结论]通过将本方法应用到科研机构年度发表论文的监测当中,可以监测分析科研机构发文作者、关键词、发表期刊及其相互间关系(如作者-关键词等)在各年的突发情况,并能通过该分析方法以及交叉图谱进一步解读突发特征项的含义,并能揭示出比分析单一特征项突发情况更为广泛和深入的知识内容。  相似文献   

8.
赵一鸣  尹嘉颖 《情报学报》2023,(10):1187-1198
共词网络是研究语言现象的重要方法,语义特征是词汇共现现象中重要的隐性知识,研究共现词之间的语义关系及特征,可以从语义视角改进共词网络的研究,并利用语义学知识为现有的共词分析方法赋能。本文提出了一种语义增强型的共词网络构建和分析方法,从共现特征、网络特征与语义特征3个维度丰富了共词网络节点和边的属性。通过实验构建了基于14万余篇新闻文本数据的语义增强型全文本共词网络,并重点对共现词对的语义特征进行分析,结合案例呈现了该方法在计算语言学研究和行业应用上的价值。本文从词间语义关系的视角,拓展了共词网络的构建和分析方法,描述了共现词汇的语义特征,证实了语义关系的非对称性和传递性,为语义关系的分类与推导提供了理论依据,在语义消歧、词义理解等方面具有应用价值。  相似文献   

9.
国内外文本分类研究计量分析与综述   总被引:1,自引:0,他引:1  
运用文献计量分析方法、计算机统计分析技术、社会网络分析软件对文本分类领域的历史文献进行计量分析及可视化,通过绘制文献数量分布图、核心关键词的共现网络,挖掘文本分类领域的发展趋势、目前研究概况、热点及未来研究趋势等信息,并对文本分类领域研究热点和未来研究趋势进行综述。  相似文献   

10.
针对某一领域的文献,如果两个研究对象同现的频率越高,则通常假设二者存在联系的可能性越大,从而促使共词分析、文献共引分析以及文献作者共著分析等共现分析方法的流行.然而,传统共现分析三个阶段中的前两个阶段存在一定的缺陷,从而导致最后得到的共现聚类分析的结果可能存在一定的误导性.为克服该缺陷,本文从关联规则挖掘领域引入了一种新的共现聚类分析方法--最大频繁项集挖掘,它将传统共现分析法的三个阶段压缩为一个阶段,充分利用了可以利用的各种信息,克服了传统方法的缺陷.通过实验分析发现,设置合适的最小支持度阈值,基本上可以得到比较满意的结果.  相似文献   

11.
通过总结Web文本挖掘在竞争情报中的应用,尝试将Web文本挖掘方法应用于行业态势分析,提出基于行业态势分析的Web文本挖掘流程,并以2011年上海车展中的相关报道,采用时空分布、词频分析、共现分析等方法对汽车行业态势分析进行实证研究,最后探讨我国汽车行业的发展趋势。  相似文献   

12.
本文从文本挖掘的定义着手,分析了文本挖掘的过程,包括文本预处理,文本知识发现,文本模式的评价以及文本模式的呈现,并详细介绍了文本挖掘在主动信息服务、信息检索系统、专利信息分析等方面的应用.  相似文献   

13.
[目的/意义]作为一类面向学科领域科技情报需求、针对全文本关键语义计量分析、旨在实现情报自动化到知识自动化实践应用的探索研究,本文基于语义标注和机器学习等技术,在前期研究从知识元共现视角探测研究前沿演进机理基础上,进一步提出一种基于知识元变异的研究前沿知识演进分析方法。[方法/过程]利用Word2vec词嵌入模型将知识元表示为词向量,通过计算知识元向量的欧几里得距离,利用K-means聚类方法识别具有相似语义语用关联的知识元簇集,计算历时簇集内各知识元TF-IDF值,对变异后知识元重要程度的突发变化结果进行定量测度,进而挖掘ESI研究前沿演进中的知识元变异特征和规律。[结果/结论]通过探测结果的对比检验发现,基于知识元变异的科学计量方法,不仅是对前期研究方法的补充和拓展,使得针对研究前沿内部知识运动规律的挖掘更加具体详实,更是在时间序列范畴内,能够尽早、及时探测研究前沿未来发展动向和关键情报信号的有力证据。  相似文献   

14.
文献数据库中书目信息共现挖掘系统的开发   总被引:9,自引:0,他引:9  
针对权威的生物医学数据库和引文索引数据,介绍一个基于文献数据库中书目信息共现关系进行文本挖掘的系统。该系统具有基本的文献计量学分析功能,并对相应的结果进行可视化表达;对高频主题词、高产作者和高被引论文和高被引作者进行共现分析,据此进行聚类分析和关联分析,获得有关的研究主题聚类和主题词/副主题词关联规则、合著聚类分析、高被引论文同被引聚类分析和高被引作者同被引聚类分析的结果和可视化表达。其中对关联规则的分析可以发现主题词之间的潜在语义规则,其他的文献计量学指标和共现分析结果可以用于科学计量学的分析。  相似文献   

15.
CSSCI数据导入Bibexcel实现共现矩阵的方法及实证研究   总被引:4,自引:0,他引:4  
以针对Web of Knowledge开发的文献信息共现分析的应用软件——Bibexcel为研究对象,结合CSSCI数据库数据格式特点,解决了Bibexcel不能处理中文文献的瓶颈问题,实现了知识单元共现关系矩阵。并以CSSCI数据库中1998-2008年信息可视化引文数据为例,数据经过预处理后,由Bibexcel构建其知识单元共现矩阵,利用Ucinet、Netdraw软件,实现了作者共现、关键词共现、引文共现的可视化分析。本研究扩展了Bibexcel的应用范围功能,为CSSCI数据的可视化研究提供了一种新的手段。  相似文献   

16.
“十一五”期间我国文献情报领域知识发现研究综述   总被引:1,自引:0,他引:1  
对近年来关于知识发现的大量相关论文从概念关系辨析、知识发现方法体系、文本挖掘与文本趋势挖掘、非相关文献知识发现、数据挖掘研究拓展等方面开展研究,总结“十一五”期间我国文献情报领域知识发现研究成果,重点介绍有关知识发现的内容分析、关联理论、领域驱动、可视化、文本挖掘模型等研究进展,最后分析展望今后该研究领域的研究热点和研究方向。  相似文献   

17.
TF-IDF是一种常用的文本特征选择方法。基于该模型的特征选择思想,以特征项的类内分布、类间分布信息为依据,通过引入类内分布及类间分布权重因子对模型的TF及IDF部分进行加权,提出一种基于类别分布信息的文本特征选择模型。新模型使得TF部分含有类内文本频数信息,同时IDF部分含有特征项的类间频数信息。随后的文本分类试验表明,平均查全率、查准率分别提高6.4%、7.8%,F1值提高约7%,验证了本研究提出的基于类别分布的文本特征选择模型的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号