首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 562 毫秒
1.
[目的/意义] 采用hLDA从专利语料库中抽取层次主题,以描述隐藏在专利文本中的技术结构,并基于层次主题随时间变化情况进行技术演化分析。[方法/过程] 从专利术语中获取闭频繁项集,并基于此建立关联规则网络来度量术语的重要性和术语间语义关系强弱,进而对语料库进行重构,并对不同时间片段的专利集合进行层次主题结构抽取。[结果/结论] 将本方法应用于硬盘驱动器磁头领域的专利数据分析,实证结果表明该方法是一种可行和有效的技术演化分析方法。  相似文献   

2.
梁爽  刘小平 《图书情报工作》2022,66(13):138-149
[目的/意义]梳理国内外基于文本挖掘的科技文献主题演化相关研究,对主题演化分析中使用的各种方法进行分类、归纳与总结,并提出现有研究存在的不足,为主题演化研究提供新的思路与借鉴意义。[方法/过程]依照国内外学者进行主题演化研究的一般流程,对数据集选取与对象分析、主题识别研究、主题演化研究(主题演化时序分析、主题强度演化分析、主题内容演化分析)3个分析层面中所使用的各类模型、指标与方法进行梳理比较与优缺点总结,提出现有研究的局限性并对未来发展做出展望。[结果/结论]当前研究已具有一定规模和较为成熟的分析体系,但仍存在以下不足:数据来源较为单一;LDA及相关扩展模型存在的弊端需进一步克服;缺乏对其他机器学习及深度学习算法的探索应用;演化分析方法需相互结合、互补互融。未来应针对以上问题做出相应改进与深入探究。  相似文献   

3.
[目的/意义] 揭示2009年以来国际图书情报领域研究前沿的主题结构及其演化规律,探测未来研究的前沿趋势,为相关研究者追踪前沿信息提供参考。[方法/过程] 以Web of Science为数据源,以2009-2016年5月发表在图书情报领域12种核心期刊的文献为研究对象,基于文献共被引分析方法,利用CiteSpaceⅢ软件工具,绘制2009-2016年5月国际图书情报领域研究前沿主题的知识图谱。[结果/结论] 2009年以来,国际图书情报领域形成了h指数、特征因子、文献计量知识图谱、科研绩效等十二大研究主题。其中,通过转折节点文献,派生出新的研究前沿,形成了h指数、语言模型、概念模型、科研绩效、替代计量学、信息情感等前沿主题,未来研究呈现多元化的发展趋势。  相似文献   

4.
[目的/意义]运用深度学习技术,提出结合时间和空间特征的测度(速度、覆盖度和迂回度)方法,用于量化学者研究主题演化,从而为基于内容的学者评价提供量化依据。[方法/过程]提出三维指标框架,其中速度反映作者改变研究主题快慢的平均程度,覆盖度反映作者研究内容所覆盖的主题广度,迂回度反映作者研究路径的曲折性。使用微软学术数据集中计算机科学的作者进行实证研究,并考察学者研究主题演化的三维测度和学者学术影响力和生产力的关系。[结果/结论] 实证研究结果显示,覆盖度与总被引量和总发文量的关系为单调递减,这一特征说明聚焦于特定研究主题较为深入的作者,其发文量和影响力都较大。作者研究主题演化的"速度"和"迂回度"与总被引量、总发文量都存在先增加后减少的倒U型关系。所提出的多维度指标框架不仅可在理论上丰富科学计量学对于学者研究主题转移演化及其机制的理解,而且结合深度学习模型提出了问题的解决思路。  相似文献   

5.
[目的/意义] 基于社交媒体,探索突发事件信息生命周期中不同利益相关者的动态分类及其关注主题的演变规律,为更精准的危机信息监测与动态决策提供依据。[方法/过程] 以特定危机事件的事实文本数据为来源,以利益相关者理论和动态主题模型为指导,构建三维动态主题演化模型以对社交媒体危机事件中不同利益相关者的分类与话题关注进行主题挖掘。其中包括时间粒度划分、利益相关者的定量评估、基于时间和主体的危机主题观点识别与刻画,并利用可视化工具对该动态趋势进行表征。[结果/结论] 基于三维动态主题演化模型,利益相关者的组成与分类在不同阶段中具有明显的差异性,同时其关注主题与行为特征也体现出不同的偏好性和动态差异性。危机主体的动态与危机主题的动态有效结合,能够更加全面地表达舆情传播的特点和规律。  相似文献   

6.
[目的/意义]分析学科主题演化趋势,对科研人员研究学科知识、决策层规划学科布局都有重要意义.相比于词频分析法和共引分析法,共词分析法的优势是能深入文献内部,从微观角度揭示学科主题演化规律.分析中国国内基于共词分析法的学科主题演化研究现状,以期为相关研究人员提供参考和借鉴.[方法/过程]采用人工判读法提炼出基于共词分析法的学科主题演化研究分析流程的5个步骤,并对每个步骤中研究人员使用的策略、分析手段和工具进行归纳总结.[结果/结论]数据集的来源数据库主要有综合类、专门类和引文类等3种,检索策略有基于词、基于期刊和复合检索策略等3种;共词分析对象来源主要为作者关键词,关键词选取主要基于关键词词频、关键词共现词频和前两者相结合3个角度;构建共词矩阵时使用得最多的归一化系数为ochiai系数;最常用的主题演化分析手段为聚类分析和社会网络分析图谱;使用得最频繁的工具为SPSS软件.  相似文献   

7.
[目的/意义]随着信息资源在数量和种类上的急剧增长,学科间的交叉融合不断涌现,快速主动地从海量信息资源中识别和判断研究主题的发展演化是实现科技创新的基础。[方法/过程]在相关理论调研的基础上,结合医学领域的资源特点,提出一种基于LDA模型的主题演化探测模型和相应的流程步骤。主要步骤包括医学主题词抽取、主题识别、主题关联、关键主题识别、关键主题的演化主路径识别、演化主路径上主题分裂、融合事件识别,实现深度、细致的主题演化分析。[结果/结论]选用乳腺癌治疗研究文献为实验案例,对判断模型进行试验并对结果进行分析验证,证实提出的技术方法具有一定的可靠性。  相似文献   

8.
王平 《图书情报工作》2014,58(22):70-77
自动挖掘科技文献主题并识别主题变化对于科研工作者及时获取相关领域的最新研究动态有着重要作用.针对科技文献主题多样、动态性强等特点,分析科技文献主题发现及演化具体方法,基于层次概率主题模型hLDA,采用Gibbs抽样来进行模型参数估计,并运用互信息的方法对主题词进行筛选,以提取高质量的主题词.最后,利用先/后离散分析方法研究主题随时间的演化问题.实验结果验证了主题发现及演化方法的可行性及有效性.  相似文献   

9.
[目的/意义] 通过量化计量指标对研究主题的知识扩散进行测度与分析,客观地展现研究主题所包含的知识单元的扩散路径及其扩散规律。[方法/过程] 以Web of Science(SCI-E&SSCI)数据库核心合集为数据来源,通过被引参考文献检索方法,以J.E. Hirsch 2005年首次提出H指数概念的文献为被引文献,检索2005-2015间引用该文献的施引文献,得到样本数据。借助信息可视化分析工具CiteSpace分别进行关键词共现与文献共被引分析。将分析结果通过本文所提出的双阶知识扩散度指标Q算法进行计算,得到指标Q量变情况,并进一步分析H指数研究领域的演化扩散状况。[结果/结论] H指数研究主题的知识扩散的相关性随着流动阶层的增加而降低;H指数研究主题一、二阶知识扩散文献的主要研究方向不同,二阶文献更侧重于应用领域的拓展,这也是该研究邻域知识流动的新增长点;通过对H指数研究主题的分析,证明了本文所提出的双阶知识扩散度指标Q的准确性及科学性。  相似文献   

10.
胡潜  石宇 《图书情报工作》2016,60(8):106-112
[目的/意义] 更全面地理解用户标签使用行为的影响因素,为标签推荐和应用实践提供指导。[方法/过程] 采用日志分析法,从人均标签个数、标签类型分布两个方面分析图书主题的影响,并以计算机、心理学、经济学、文学作品、绘画5类图书为例,基于社会化标注社区豆瓣网的用户数据进行实证分析。[结果/结论] 图书主题会对用户的标签个数及类型分布具有显著影响:①在标签个数方面,计算机、心理学、经济学、文学作品主题图书的人均标签个数相近,显著高于绘画主题图书;②在标签类型分布上,根据5类图书间的差异可分为3组:计算机、心理学和经济学、文学作品和绘画。这一结论对图书标签推荐及图书分面检索和导航系统的设计具有参考作用。  相似文献   

11.
[目的/意义] 在大数据时代面对海量的数据用户有时会束手无策。因此,越来越多的学者们开始关注互联网热点话题发现的算法,帮助用户快速获取热点话题。[方法/过程] 基于DBSCAN算法,通过动态调整参数来优化算法,实现热点话题发现。根据句法结构与句间关系分析构建热点话题过滤模型,过滤包含热点词项的一般话题。[结果/结论] 采用主流网站新闻数据集进行实验,利用错检率、漏检率等评价指标对算法的有效性进行检验,实验结果证明改进算法性能有所提升,能够为信息用户提供科学研究网络数据的高效途径。  相似文献   

12.
[目的/意义]基于时间网络影响力模型,研究微博话题的时变传播特性。[方法/过程]首先构建微博话题影响力网络模型,给出影响力网络的定义、关键因素分析、模型以及网络权值的计算方法,在此基础上,基于时间网络影响力模型研究微博话题时变传播特性,利用新浪微博平台及DATAMALL的最新微博话题数据仿真分析微博话题随时间的动态传播过程以及对用户的影响力强度。[结果/结论]微博话题随时间的动态传播过程以及对用户的影响力强度之仿真分析结果表明:约有93.3%的话题延迟在1-5小时以内,同时微博话题的影响力网络权值越高,相应的转发评论人数越多,微博话题的影响力也越大。最后将本文提出的TNIM模型与传统的影响力网络模型LDA进行对比,结果显示TNIM模型的影响力网络权值的准确性和稳定性都高于LDA模型,验证了TNIM模型的有效性。  相似文献   

13.
[目的/意义] 重点针对一些在数据库中无法找到既定的主题分类,无法罗列完整关键词,也不可能通过选择有代表性机构和现成的学科领域核心期刊的方法实现数据集构建的领域,提出一种基于期刊主题相似性的领域分析数据集构建的方法。[方法/过程] 该方法组合运用引文分析与期刊文献耦合分析方法,并借助科学知识图谱绘制方法,通过确定学科领域的代表性期刊群组,经过不同形式的组配最终达到满足不同层次需求的构建数据集的目的。[结果/结论] 本方法可以满足宏观、中观和微观不同领域分析层次的需求,操作过程简单灵活且人工干预的程度不高,通过在具体领域的实例验证,证明其可以有效地解决一些领域数据集构建的难题,对今后相关研究具有一定借鉴意义。  相似文献   

14.
国内外颠覆性技术发现方法研究综述   总被引:6,自引:1,他引:5  
[目的/意义] 对国内外颠覆性技术发现方法进行系统梳理,分析存在问题,提出未来研究方向,为今后颠覆性技术识别方法的研究奠定基础。[方法/过程] 在辨析颠覆性技术与相关技术概念的基础上,分析总结目前各种颠覆性技术发现方法及优缺点,并整理归纳各方法所依据的主要评判思想和指标。[结果/结论] 现有的颠覆性技术发现方法主要是基于技术管理与应用角度的主观分析,基于专利或科学论文统计分析的客观性探测研究也开始少量出现,但均处于待发展阶段,仍然存在许多不足之处;颠覆性技术发现方法未来研究方向应该是利用情报学理论方法,基于专利与论文两者相结合的数据源,从客观性角度建立颠覆性技术识别的合理、适用的指标体系,提升技术发现的准确性和有效性。  相似文献   

15.
[目的/意义] 综述若干国外竞争情报服务流程和技术竞争情报服务流程,强调情报流程在情报工作中的重要性。对比分析已有情报流程的特征。[方法/过程] 从竞争情报服务和技术竞争情报服务两个方面,分别阐述各代表性服务流程的特点和效果,对比分析各流程的关键要素。[结果/结论] 指出已有的情报服务流程忽视了关键情报课题的作用,提出建立以关键情报为轴心的服务流程。  相似文献   

16.
[目的/意义] 提出一种融合评论主题识别与技术属性多维度分析的技术机会发现方法,从技术需求驱动视角识别技术机会,为企业前瞻布局研发方向与进行科研管理规划提供决策建议支持。[方法/过程] 以产品在线评论为研究数据源,首先,利用LDA主题模型识别出评论技术主题,提出技术评论主题强度和主题新颖度两个指标,筛选出新兴重点技术评论主题。然后,从学术论文、技术专利中人工选取技术属性词,通过TF-IDF值计算得到评论高频词,结合专家知识进一步筛选出技术特征词,构建产品技术属性词-技术特征词表。通过相关性计算分别得到与评论相关和与新兴重点技术评论主题相关的技术属性。最后,提出一种产品重要技术属性识别指标模型并设计一种多维度分析方法,分析产品重要技术属性的特征情况,最终识别出蕴含在评论文本中的新兴技术机会。[结果/结论] 实验结果表明该方法能够有效地识别技术机会,为企业产品技术研发管理提供参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号