首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 359 毫秒
1.
李慧  王丽婷 《情报科学》2018,36(4):45-50
【目的/意义】随着网民规模的扩大以及微博数据的增长,获取微博空间的热点话题是一项有价值的任务。 本文结合微博的特点提出专门针对中文微博的热点话题发现模型。【过程/方法】本文提出利用词项H指数筛选出 热点词项,然后利用BTM建模和VSM建模的结果相融合计算文本相似度,再利用k-means 聚类算法发现微博的热 点话题。【结果/结论】本文在提取特征阶段既考虑了微博词项的热度又考虑了其短文本性,通过实验验证本文提出 的方法有利于发现准确的热点话题。  相似文献   

2.
马哲坤  涂艳 《情报科学》2019,37(2):33-39
【目的/意义】为了实现突发事件网络舆情热点话题的及时发现与捕捉,实现多角度、全方位、高精度的网络 舆情突发事件监测,精准构建特定时间区间内网络舆情突发事件的知识图谱监测模型对于舆情内容的监测和突发 话题的发现具有重要影响。【方法/过程】本文基于知识图谱理论,提出了一种新的网络舆情监测方法,以突发事件 网络舆情的时间特征为切入点,通过突发词项识别、构建突发话题图以及语义补充与完善三个步骤,在保留突发事 件特征的基础上有效过滤无关网络内容,构建包含语义关系的突发话题图,实现全方面、高精度、少噪音的突发事 件网络舆情热点话题监测。最后,本文以全标注微博数据集与在线微博数据流为基础展开实验研究。【结果/结论】 实验结果表明:基于知识图谱的网络舆情监测方法有效提升了突发事件网络舆情监测的准确性与全面性,相较于 传统的网络舆情监测算法,其突发事件监测准确率与召回率提升幅度大于6%, F1得分提升幅度大于12%,即通过筛 选突发词项、构建突发话题图、语义补充与完善三个步骤,基于知识图谱的网络舆情监测方法在理论层面上有效提 升了突发事件网络舆情监测的准确性与全面性,对于及时发现网络舆情话题、精确捕捉网络舆情发展趋势、针对性 防治网络舆情危机等具有重要的指导意义。  相似文献   

3.
李慧  王丽婷 《情报科学》2019,37(1):30-36
【目的/意义】掌握微博热点话题演化规律有利于让公众了解正确的话题演化方向,也便于有关部门对舆情 监控和引导,使得舆论朝着正能量的方向发展。【过程/方法】利用OLDA(On-line Latent Dirichlet Allocation)可以实 时地追踪热点话题演化的优势以及微博的“话题标签”的特性提出适合微博的热点话题演化模型LOLDA(Label On-line Latent Dirichlet Allocation),然后通过Python编程爬取了新浪微博的数据,从话题内容和强度两方面分析 了话题演化规律,并对话题内容演化规律进行了可视化展示。【结果/结论】改进的LOLDA模型可以准确地发现微 博话题演化规律,通过实验验证了本文提出的模型较传统模型具有更好地泛化能力.  相似文献   

4.
为了解决对微博海量信息采集分析的问题,为此本文研究提出基于微博意见领袖参与行为的热点话题检测算法。微博意见领袖在微博话题传播和演化过程中具有加速传播和引导等作用,本文从具有影响力的微博意见领袖采集微博信息,对信息数据进行加工处理以得到微博话题,并利用Single-Pass聚类算法作为核心算法进行话题的抽取,有效地提高热点话题检测的效率。  相似文献   

5.
陈璟浩  陈美合  曾桢 《现代情报》2021,40(10):11-21
[目的/意义] 利用新冠疫情网络舆情数据来研究突发公共卫生事件中中国网民关注度,有助于提升疫情期间政府信息供给效率、满足公众需求和提供社会支持等。[研究设计/方法] 通过新浪舆情大数据平台获取研究数据,包括:疫情流行高峰期间全网舆情数据、每日转发排名前100名热门微博、每日新增病例数据等。采用描述性统计、列联表分析、回归分析等方法,研究突发公共卫生事件中网民关注度变化趋势及影响因素。[结论/发现] 疫情爆发初期,媒体大规模报道造成大量网民对事件关注;随着疫情严重,新增病例与网民关注出现同频共振;媒体报道初期,网民关注度集中趋势高;防疫举措、鼓励加油、捐献赠送、倡议建议、赞誉肯定5大关注主题,贯穿疫情流行高峰;主流媒体发布微博受关注最多,不同账户类型情感倾向有显著差异;网民总体关注度受新增病例和变异系数影响;每日热门舆情关注度,受新增病例、变异系数、舆情总量和戏剧性分值影响;单条微博受关注程度与当日相关话题总量和微博粉丝数有一定关系。[创新/价值] 本文系统分析了突发公共卫生事件中网民关注度变化趋势和影响因素,为政府决策提供支持。  相似文献   

6.
[目的/意义]当前各学科领域文献增长迅速,迫切需要以面向“问题解决”的思路,从大量科技文献中抽取出研究问题、解决方案及其解决关系,并以此为基础开展领域知识演化研究。[方法/过程]文章提出了可应用于实践的低成本领域实体关系抽取方案:依托词嵌入类比的思想,仅从领域知识资源中提取的少量实体关系对作为基准即可实现关系分类。[结果/结论]在人工智能领域数据集上使用基于词嵌入类比方案的集成模型,抽取解决关系、问题层级关系、方法层级关系的F1值分别为82.33,81.49,74.81。最后,将集成模型应用于全量数据抽取实体关系,从宏观、中观、微观三个层面展示了面向问题解决的人工智能领域知识演化情况。  相似文献   

7.
吴树芳  杨强  侯晓舟  尹萌 《情报杂志》2023,(11):119-125
[研究目的]引导式主题模型可以引导生成有倾向性的敏感主题,提高网络敏感信息识别性能,对维护国家安全和社会稳定具有重要意义。[研究方法]针对当前网络敏感信息识别研究构建敏感信息特征不全面和不准确,从而导致识别性能欠佳的问题,提出基于SSI-GuidedLDA模型的引导式网络敏感信息识别方法。首先,从多源网络资源中爬取敏感种子词,并基于词向量模型Word2Vec获得种子词的敏感语义相关词,构建更为完备、准确的敏感特征。其次,将构建的敏感特征融入引导式主题模型,得到改进后的模型SSI-GuidedLDA。最后,基于SSI-GuidedLDA模型获得待识别信息的主题分布,通过主题分布概率判断其是否为网络敏感信息。[研究结论]在新浪微博数据集上的实验结果显示,与已有方法相比,提出的方法在准确率、召回率和F1值上均有一定提高。  相似文献   

8.
王志宇  刘雨薇 《现代情报》2024,(3):47-58+119
[目的/意义]利用政务微博信息构建自然灾害知识图谱,旨在为相关部门加强自然灾害事件的管理提供知识层面的参考价值。[方法/过程]以森林火灾事件为例,选取政务微博信息资源,首先使用LDA主题模型划分微博资源主题;其次构建自然灾害知识图谱的模式层和数据层,包括本体构建、实体抽取、关系抽取和数据融合等环节;最后使用Neo4j图数据库实现自然灾害知识图谱的存储与检索,实现自然灾害信息的组织与可视化。[结果/结论]构建了基于主题划分的自然灾害知识图谱,实现了自然灾害信息的主题知识关联与规范化处理,对提升政府部门防范与管理自然灾害的科学决策水平具有积极作用。  相似文献   

9.
[研究目的]为实现网络热点话题的在线检测,提升增量式聚类算法的聚类效果,提出了基于组合相似度的动态聚类算法,同时通过计算词熵实现主题词提取和演化跟踪。[研究方法]通过CIFG-BiLSTM-CRF模型实现文本的命名实体识别,计算文本与话题的实体相似度,再取文本词向量与话题中心余弦相似度的最大值作为词向量相似度,二者结合判断文本所属话题。在聚类过程中利用时间窗口策略实现话题中心和成员文本的动态更新。同时,计算文本词熵,生成话题的词熵和列表,实现话题主题词提取和演化跟踪。实验以新冠疫情新闻为数据实现话题在线检测,并展示了话题主题词的演化和跟踪过程。[研究结论]实验表明,与传统相似度计算方法相比,组合相似度能够获得更好的聚类效果,聚类过程中提取出的话题主题词也正确地反映了原始数据的热点话题内容。  相似文献   

10.
基于共词分析的学科主题演化方法改进研究   总被引:2,自引:0,他引:2  
学科主题演化是情报分析人员采用一定的信息技术方法观察主题在时间维度上的发展、变化趋势以及不同主题之间的交互作用,它已成为情报研究的一项重要内容。基于词频或共现词频的共词分析方法难以反映主题词对间更层次的语义关系,针对这一情况,提出一种改进的共词分析方法,该方法体现主题词、主题和文档间的层次语义关系,以更微观、精确的语义层面展现主题演化过程。  相似文献   

11.
[目的]从海量微博舆情信息中准确、高效地发现和挖掘当下的热点主题,以期为政府和企业监控和管理舆情动态提供有价值的参考。[方法]研究首先从维度、特征和度量三方面综合考虑构建"帖子-主题"二模网络模型,其次选择词频、主题权重和词频增长率3个特征来抽取模型所需的有效关键词,然后选取社会网络分析法中的社区发现方法进行基于关键词的主题社区发现,最后综合考虑用户影响力和传播影响力两个属性,通过热度分析确立主题热度,识别热点主题。[结果]实验表明,该方法能有效挖掘网络舆情中的热点主题,检测出的主题结果均正确,验证了本文方法的可行性和有效性。在此基础上,研究还选取实例进一步对主题的热度迁移和情感倾向进行了分析,具备一定的预警作用。  相似文献   

12.
[研究目的]基于研究前沿多维特征指标测度识别研究前沿,分析科学前沿主题与技术前沿主题间的联系及其演化。[研究方法]首先,对论文和专利数据进行主题挖掘,从前沿主题特征出发通过新颖度、增长性、影响力和交叉性4个测度指标识别出研究前沿,分析科学前沿主题与技术前沿主题间的联系;其次,通过主题相似度计算、主题过滤等方法识别具有演化关系的主题对,并对前沿主题内容演化过程进行可视化分析。[研究结论]以固体氧化物燃料电池领域为例,识别出了包括固体氧化物燃料电池堆研究等在内的4个科学前沿主题与复合电极材料在内的4个技术前沿主题,科学研究与技术研究互相推进,呈现双螺旋式发展。  相似文献   

13.
[研究目的]数字孪生是实现工业4.0的关键技术,揭示中美两国数字孪生研究主题的异同对我国数字孪生的研究与发展具有重要意义。[研究方法]以WOS核心合集中的期刊文献作为分析样本,利用结构话题模型分析方法获得了15个主要的研究主题,然后进行了主题数量、主题内容和主题时序演化等维度的比较分析。[研究结论]中美两国数字孪生研究主题存在较小的共同研究旨趣,研究内容总体差异较大,主题数量差异较小,研究范围差异较大。中美研究者对同一话题的关注内容具有各自鲜明特征。大部分研究主题的强度随着时间发展呈现出了显著变化。根据中美数字孪生研究的主题差异,未来我国需要推动数字孪生关键技术的研发,建立健全数字孪生的研发机制,加速推进数字孪生技术应用领域。  相似文献   

14.
[目的/意义]为提高新兴技术主题识别的全面性、准确性,在专利、论文信息的基础上,融入舆情信息,提出一种复合型的新兴技术主题识别方法,以期能为微观层面新兴技术主题识别方法的研究提供参考。[方法/过程]面向专利、期刊论文、学位论文、会议论文、舆情共5种不同的科技文献类型,运用LDA模型从多源异构文本中获取主题词,并进行融合分析,提取候选新兴技术主题;设计识别指标体系,弥补现有指标体系缺乏未来前景相应指标的不足;运用CRITIC法进行综合评价,确定最终的新兴技术主题。[结果/结论]以智能网联汽车为实验对象,成功识别出多传感器融合信息技术这项新兴技术,实验结果与业界分析保持一致,说明多源信息视角下的多指标新兴技术主题识别方法能有效地对多源异构文本开展新兴技术的主题识别。  相似文献   

15.
[目的/意义]准确把握公众微博评论中所反映的公众观点并总结舆论焦点,有助于及时获取和引导社会舆情态势,对政府公信力、快速响应能力及执行力提升具有支撑作用。[方法/过程]文章针对当前政府微博评论社会功能发挥的现实要求和其文本特征挖掘的技术需求,从基于深度学习的文本智能语义理解和挖掘出发,提出了适用的细粒度四元组标注策略,构建了政府微博评论观点抽取与焦点呈现的深度学习模型POF-BiLSTM-CRF,即通过细粒度标注策略确定、Word2vec训练词向量、BiLSTM评论特征学习进行标签及其概率输出、CRF学习上下文实现微博评论标注优化,以及观点聚类和主题词提取后最终呈现舆论焦点。[结果/结论]针对"中国警方在线"微博评论的实验表明,文章所提研究框架和模型能够有效进行舆论观点的智能化提取,为快速把握公众观点及为政府决策提供了参考。  相似文献   

16.
【目的/意义】从学者的合作网络中进行社区发现及主题分布研究是具有十分重要的意义点。本文从社区 结构及其主题分布演化的角度分析并归纳情报学领域的研究现状和预测未来发展趋势。【方法/过程】本文通过构 建动态社区-主题模型,拟研究情报学文献中合著社区及其研究主题演变过程。【结果/结论】2000-2017年间,合著 网络社区演化呈现松散到聚合的趋势,在2012-2017年间基本形成三个大型的社区,每个社区的主题演化路径有不 同的模式:分裂融合模式、主干聚集模式和主干分解细化模式。不同社区的主题变化影响着社区演化路径。每个 社区的主题分布具有逐步多样化的特点,并且与数据挖掘、大数据分析、人工智能的研究日益紧密。  相似文献   

17.
邓雯  毛子骏  徐晓林 《情报杂志》2022,41(2):119-125
[研究目的]基于官方和民间双视角开展风险沟通研究,可以弥补已有研究视角单一的问题,体现“沟通”的本质。[研究方法]以新冠肺炎疫情为案例,采用文本挖掘和主题建模方法,对《人民日报》微博账号@人民日报的报道内容和公众评论进行话语分析。[研究结论]两个话语场表现出了均衡的双向影响力,展现出“共识-分歧-下一个共识”的互动模式。但是两个话语场仍然存在信息供求不匹配、议程分化等问题。这有待官方进一步利用技术赋能,建立良好的沟通机制,推动双方走出对话盲区,谋求意义共通。  相似文献   

18.
[目的/意义]产业变革快速演进,技术创新成为驱动社会经济发展、提高国家和企业科技竞争力的关键所在,如何对前沿技术进行识别和预测,成为国家科技政策研究和企业技术创新活动关注的热点。[方法/过程]以人工智能作为重点研究领域,首先以LDA模型进行技术主题抽取,并结合K-means算法进行专利文本聚类;在此基础上,以Z分数表示技术主题创新度,以Sen's斜率估计技术主题授权趋势,两个指标结合形成技术主题前沿度并将二者映射到二维空间,识别前沿技术主题以及划分技术主题类型;再,计算前沿技术主题的新颖度和关注度,二者融合形成技术主题趋势度指标;最后,采用三次指数平滑法对前沿技术主题的发展趋势进行预测。[结果/结论]人工智能领域的前沿技术主题有“智能家居”“电动汽车”和“自动化控制系统”,其中“智能家居”在未来3年的发展呈下降态势,而“电动汽车”和“自动化控制系统”的发展呈明显上升趋势。  相似文献   

19.
[目的/意义]对比论文数据和专利数据的特征指标,识别热点、新兴、潜在和消亡研究前沿主题.[方法/过程]利用LDA主题模型,对智能汽车领域相关的论文数据和专利数据进行主题提取,计算两个数据源下各主题的强度和主题新颖度并进行对比分析.[结果/结论]本文识别出路径规划技术等热点研究前沿6个、智能计算等新兴研究前沿2个、安全认...  相似文献   

20.
[目的/意义]借鉴拉斯韦尔5W传播模型,探讨微博中预置话题与突发话题的特征。[方法/过程]基于因子分析的关键节点影响力评价方法来研究话题节点特征;利用Ward方法对话题博文量曲线进行聚类,并对曲线进行多项式拟合;对话题情感度曲线进行聚类,并对不同类型话题的峰度和整体情感加权平均高峰期进行研究。[结果/结论]话题首节点多是信息分享,其中突发话题的传播多是从事件的客观描述开始;话题微博按博文量可分为前热型、中热型、后热型、爆发型和持续型,其中突发话题比预置话题爆发得更早、持续时间更长;话题出现72小时后公众情感趋于中立,但突发话题情感曲线高峰期比预置话题更集中,整体情感加权平均高峰期更早出现,曲线趋势更复杂。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号