共查询到17条相似文献,搜索用时 781 毫秒
1.
基于LDA模型和微博热度的热点挖掘 总被引:3,自引:0,他引:3
分析传统LDA模型在进行微博热点挖掘时所得概率结果抽象且难以结合实际解释的缺点;考虑到微博本身的数据特点和信息论中信息量的观点,提出微博热度的概念,并将其引入到LDA模型的热点挖掘研究中,构建基于微博热度的LDA模型;通过API采集微博数据上的实验,证明新方法与旧方法具有相同的性能,而且能得到更直观的微博热度表,并得出更具有说服力的挖掘结论。 相似文献
2.
基于主题聚类的学科研究热点及其趋势监测方法 总被引:1,自引:1,他引:0
常规的学科热点及趋势监测方法存在监测成本高、监测信息相对滞后等问题.因此需要寻求较低成本、较快速的方法进行学科热点和趋势的监测,以保证监测系统提供信息的时效性.本文以图书情报档案学科为例,依据学科学术论文全文,从主题角度对学术论文集合进行全面分析,即:采用主题聚类方法,对包括时间信息的学科学术全文进行主题分析与主题聚类,归纳出某一特定学科的研究热点和这些热点的发展趋势.实验结果表明,基于主题聚类的学科热点及其趋势监测方法,其监测结果在很大程度上接近于常规方法的监测结果,但基于主题聚类的监测方法,在监测成本和监测信息时效方面得到改善. 相似文献
3.
[目的/意义]以情报学为例,探索基于社会化问答网站热点的学科认知特点挖掘方法及其可行性。通过总结归纳知乎用户对情报学的知识期待和学科认知,为情报学学科建设提供特定参考。[方法/过程]以知乎情报学话题下的"精华"讨论内容作为分析对象,运用聚类分析、多维尺度分析等方法挖掘关注热点,并对这些关注热点的自身属性、相互关系和核心程度等特征进行分析与探究。[结果/结论]知乎的情报学关注热点可分为信息检索与搜索引擎、网络营销与电子商务等7类,反映出大众对情报学的技术、商业、学科、社会4方面的知识需求,进而构建出信息技术、现实应用、信息社会3个维度的学科认知特点。 相似文献
4.
[目的/意义]为应对微博内向型传导热点生灭速度快、热点特征不明显等问题,研究新型的微博内向型传导热点发现与预测算法。[方法/过程]针对上述问题,基于复杂网络分析方法,构建微博传导热点预测算法,该算法通过复杂网络节点模型扩展生成微博传导节点模型,发现内向型传导节点的传导子网;通过对传导节点序列实施热功率计算,对其信息传导覆盖范围以及未来影响力进行预测,进行传导热点发现及预测。[结果/结论]数据实验表明,该算法较之目前常用的热点预测算法,具有较高的传导热点覆盖率和准确率,且耗时较少,性价比较高。 相似文献
5.
[目的/意义]论文旨在比较国内外图书情报与档案管理学界的研究热点,探索学术热点与学科发展的关系。[方法/过程]论文采用计量方法考察2019—2021年间CSSCI、SSCI所反映的国内外图书情报与档案管理学科学术热点,比较其与“中国图情档学界十大学术热点”的异同,分析学术热点与学科发展之间的协同关系。[结果/结论]研究发现,国内外学界普遍关注疫情引发的健康信息问题、社交媒体中的用户行为、文献计量、图书馆管理、数据治理等问题;中国图情档学界与业界更关注学术命题与国家重大战略的连结,更加重视履行学科历史使命;学术热点推动学科发展的进程,学科建设的成果也反映在学术热点的进化中。 相似文献
6.
7.
8.
本文从高校网络舆情及大学生微博用户的特点出发,提出了高校学生微博热点话题的概念、表现形式和传播模式。在当前微博信息挖掘研究的基础上,运用网络信息采集与抽取、中文分词、文本聚类、空间向量模型等技术,结合高校学生微博舆情特点,研究设计了基于高校学生微博的舆情热点发现模型,并对该模型功能进行了介绍。 相似文献
9.
领域热点识别是科技情报与文献计量领域研究的关键问题之一,其能够为科技、教育部门的政策制定及科研人员的研究决策提供参考和依据。现有领域热点识别的研究主要基于文献计量学方法,并没有利用丰富的Web数据。本文提出了一种基于涌现模式挖掘的框架,利用社会化问答社区中的问答内容来识别领域研究热点。首先,提取问答内容中的关键词,并基于关键词的共现性进行聚类;然后,基于聚类结果构建候选研究热点模式集合,利用涌现模式挖掘方法识别领域研究热点并分析其发展趋势。本文基于知乎社区的“机器学习”话题数据集进行实验,利用卡方检验与领域前沿进行对比,结果表明该框架能够有效识别领域研究热点。该方法利用关键词聚类较好的缓解了涌现模式识别方法计算复杂度大等问题,具有良好的可行性;同时,该方法在线社区热点识别等问题中具有潜在的应用价值。 相似文献
10.
[目的/意义]针对传统领域研究热点识别方法存在的低频词被掩盖、聚类主题词杂糅难以解释等问题,提出关键词类群分析法,通过构建符合领域研究范式的关键词类群模型,洞察科研细节和研究逻辑,实现领域研究热点的全面化、结构化揭示,为领域研究热点的高质量识别提供新思路。[方法/过程]提出关键词类群分析法概念,归纳不同学科领域科研论文摘要中的研究表达范式,阐述基于研究表达范式的关键词类群建立的原则和方式,构建利用该方法进行领域研究热点识别的模型。[结果/结论 ]实证分析选取2023年作物育种领域论文为数据集,验证方法的可行性和有效性。结果表明,相较于传统的研究热点识别方法,关键词类群分析法可以有效规避“孤立点式”的分析,从“中观层”的分析视角得到更丰富、精确的领域研究热点。该方法可为领域研究态势分析、领域知识创新决策等应用场景提供高质量的情报支撑。 相似文献
11.
12.
[目的/意义]面向出版业进行专业领域出版时的选题决策问题,对互联网上公开的资讯动态进行多源整合,通过多维度的情报分析探测专业领域内的热点,实现数据驱动的出版选题决策,为出版业的数字化转型与发展奠定坚实基础。[方法/过程]设计一个情报分析模型,面向出版选题决策进行专业领域的热点探测。模型包含热点发现与热度评价两个过程。热点发现过程,通过词频统计和词增长速度算法对专业领域内的热点进行识别;热度评价过程,从内容层面和传播层面两个维度设计并计算一系列指标,对识别到的热点进行热度评价与排序。[结果/结论]以2018年1月至4月的36 550条信息、通讯和技术领域多源中文信息为样本进行热点探测实验,实验结果表明,设计的热点探测模型可以有效地探测专业领域内的热点,辅助出版业科学地进行专业领域选题决策。 相似文献
13.
[目的/意义]面对世界范围内各种思想文化交流、交融、交锋的新形势,深入挖掘国际传媒研究热点,对促进我国传媒领域的学术发展与学科体系完善具有重要意义。[方法/过程]本文以Web of Science数据库中2015—2019年传媒类期刊文献数据为基础,结合概率主题模型、文献计量方法以及自然语言处理技术对文档内容和元数据进行联合建模,构建国家-主题分布矩阵,较为全面地挖掘了近五年来国际传媒研究的地理分布与知识结构,最终落脚于国内传媒领域研究的热点主题分析。[结果/结论]研究结果表明,数字技术推动新媒体蓬勃发展,不断刺激传媒领域的产业升级与文化重塑。我国部分主题在理论研究、产学交流、学科融合等方面仍存在探索与提升的空间,需要在重视理论研究与应用研究、基础学科与新兴学科协同发展的基础上,开展符合国内需求、具有国际视野的传媒研究,为传媒领域的持续深入发展添砖加瓦。 相似文献
14.
15.
孙艳红 《图书馆工作与研究》2021,(3):93-101
本文以2010-2019年间国家基金项目为研究对象,采用文献计量法、词频分析法对图情档学科立项项目年度数量演变、项目类型分布、项目核心研究机构分布、核心研究人员分布及项目名称关键词进行统计分析。研究结果表明:图书情报与档案管理学科的国家基金立项数量呈上升趋势,研究主题在坚守传统重点内容的同时又关注新兴研究热点,发展趋势呈现出围绕智能化信息技术、紧跟时代特征、融合多学科研究的特点。 相似文献
16.
[目的/意义] 在科学研究中,从不同来源的科技文献中识别挖掘科研热点对于开展科研工作具有指导意义。旨在通过本研究提出的模型方法,快速准确地识别蕴含在多源文本中的热点主题,为科研创新提供支撑服务。[方法/过程] 提出一种基于LDA2vec模型的多源文本下科研热点识别的方法并针对科研热点识别构建模型,该方法融合LDA主题模型对隐含语义挖掘的优势和Word2Vec词向量模型对于上下文关系把握的优势。以机器学习领域的科技文献为例,利用模型困惑度和主题一致性两个指标对LDA2vec的在本领域应用的可行性和有效性进行验证,并与LDA的主题提取效果进行对比。[结果/结论] 实验结果表明,提出的方法在面对多源数据情况下,进行科研热点识别挖掘是可行的,且在一定程度上有效果的提升,对利用单一数据源进行主题分析的不足进行补充,对多数据源融合的实践应用进行丰富。 相似文献
17.
利用知识可视化软件(CiteSpace Ⅱ),对Web of Science(SCI-E,SSCI)中1975-2010 年收录的2863 篇引
文分析论文进行研究。分别分析引文研究文献的时间分布、地区分布、机构分布、期刊分布、学科分布以及学科代表人
物与其经典作品,从而直观地揭示引文分析研究发展的现状,并通过对关键词出现的频率和共现情况,确定引文分析研
究热点,基于主题词变动趋势描绘引文分析的研究前沿。 相似文献