首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 437 毫秒
1.
陈杰  马静  李晓峰  郭小宇 《情报科学》2022,40(3):117-125
【目的/意义】本文融合文本和图像的多模态信息进行情感识别,引入图片模态信息进行情感语义增强,旨在 解决单一文本模态信息无法准确判定情感极性的问题。【方法/过程】本文以网民在新浪微博发表的微博数据为实 验对象,提出了一种基于DR-Transformer模型的多模态情感识别算法,使用预训练的DenseNet和RoBERTa模型, 分别提取图片模态和文本模态的情感特征;通过引入Modal Embedding机制,达到标识不同模态特征来源的目的; 采用浅层Transformer Encoder对不同模态的情感特征进行融合,利用Self-Attention机制动态调整各模态信息特征 的权重。【结果/结论】在微博数据集上的实验表明:模型情感识别准确率为 79.84%;相较于基于单一文本、图片模 态的情感分类算法,本模型准确率分别提升了 4.74%、19.05%;相较于对不同模态特征向量进行直接拼接的特征融 合方法,本模型准确率提升了 1.12%。充分说明了本模型在情感识别的问题上具有科学性、合理性、有效性。【创 新/局限】利用 Modal Embedding 和 Self-Attention 机制能够有效的融合多模态信息。微博网络舆情数据集还需进 一步扩充。  相似文献   

2.
【目的/意义】微博情感分析对公共安全事件管控有着重要意义。现有研究将单条微博作为整体进行分析, 情感分析最小单元局限于字或词,而对微博从词到句子,从句子到单条微博这种多层粒度文本结构产生的影响关 注不足,基于此本文提出一种融合双层注意力的Bi-LSTM模型提升情感分析性能。【方法/过程】以红黄蓝幼儿园涉 嫌虐童事件为例,通过Bi-LSTM提取微博词级和句子级特征,结合双层注意力机制学习各级特征权重分布,以递 进顺序综合局部情感得到整条微博的情感分类。【结果/结论】实验结果表明,本研究提出的微博情感分析模型F1 值、准确率分别达到97.39%、97.62%,相比于SVM、RF、XGBOOST和LSTM,该模型能够在公共安全事件微博情感 分析方面取得较好效果。  相似文献   

3.
随着智能终端设备的不断普及,微博、微信等国内最受欢迎的社交平台等富含情感倾向的中英文混合极短文本数据的信息呈爆发式增长。为了有效提取中英文混合极短文本中的情感倾向等关键特征信息,本文提出了一种基于情感倾向和SVM的极短文本分类模型。首先对原数据进行识别并利用kettle、N-Gram模型对数据进行处理;然后利用TF-IDF提取分类所需要的关键词;再将处理后的数据存入词向量集;最后利用SVM对混合极短文本进行分类。经过K-fold交叉验证,检验了模型的有效性。实验以微博等主流社交平台上的6905条极短文本数据作为样本进行实验与分析。结果表明在分类准确率方面,该方法能够有效提高匹配效率;同时在泛化误差与精确度指标上匹配结果更加均衡。  相似文献   

4.
微博文本聚类是依据微博主题不同将描述同一类主题的微博文本汇聚到一起的过程。由于微博文本非常短,在使用常规的机器学习方法对微博短文本进行聚类时,常会出现严重的数据稀疏问题,继而对聚类性能产生影响。分析了中文微博文本的数据稀疏特征,并基于这一特征分析比较了几种中文微博文本表示及聚类方法,为中文微博文本聚类分析的难点问题提供了一定的解决途径。  相似文献   

5.
高欢  那日萨  杨凡 《情报科学》2019,37(11):48-52
【目的/意义】准确挖掘消费者在线评论情感倾向,对于改善商家服务具有重要意义,而情感倾向预测的准 确性仍需提高。【方法/过程】文中设计基于集成学习的在线评论情感分类算法,即以N-gram算法分析在线评论词 语特征,结合情感词典构造文本特征,利用逻辑回归、Light GBM等机器学习方法为基础的集成学习进行训练,实现 在线评论情感分类。【结果/结论】实现了评论的情感倾向预测,在电脑评论数据集,较之于经典的SVM算法和无监 督类算法,该模型的分类衡量指标F1值分别提高了10%到30%不等。同时,在酒店、图书等不同领域的数据集上显 示,该方法的分类准确性仍具有上述效果,证明了该方法具有领域移植性。  相似文献   

6.
[目的/意义]网民情感变化是影响政府舆情应对进程、政策、策略的关键。因此,构建科学高效的情感词典,对网民情感分析研究及应对策略的选择具有重要的实际意义。[方法/过程]结合扎根理论的质性研究特点,在情感词典的构造中融入突发事件演化规律影响因素,采用点互信息算法,TF-IDF,统计量等方法对微博表情符号词典及突发事件专属情感词典进行构建,编制了突发事件情感词典,随后选取"6.22"杭州保姆纵火案微博语料进行情感分析。[结论/结果]实验发现,与不加入影响因素的情感词典相比,本文构造的词典在准确率召回率等指标的对比中均得到了一定程度的提高。同时,结合扎根理论与主题分析的结果,对舆情发展的不同阶段所选择的舆情应对策略提供了参考。  相似文献   

7.
【目的/意义】从海量微博信息中提取准确的主题词,以期为政府和企业进行舆情分析提供有价值的参考。 【方法/过程】通过分析传统微博主题词提取方法的特点及不足,提出了基于语义概念和词共现的微博主题词提取 方法,该方法利用文本扩充策略将微博从短文本扩充为较长文本,借助于语义词典对微博文本中的词汇进行语义 概念扩展,结合微博文本结构特点分配词汇权重,再综合考虑词汇的共现度来提取微博主题词。【结果/结论】实验 结果表明本文提出的微博主题词提取算法优于传统方法,它能够有效提高微博主题词提取的性能。【创新/局限】利 用语义概念结合词共现思想进行微博主题词提取是一种新的探索,由于算法中的分词方法对个别网络新词切分可 能不合适,会对关键词提取准确性造成微小影响。  相似文献   

8.
[目的/意义]在社会危机事件发生后,及时、有效地对社交网络上的文本内容进行情绪分类,有助于准确掌握公众情绪状态、优化社会危机事件管控方案。[方法/过程]基于框架语义理论构建危机情绪分类词典和危机情绪类别体系,采用融合自注意力机制的LSTM神经网络分类模型,实现优化的、细粒度的危机情绪分类。[结果/结论]以微博危机事件评论数据为例,通过不同参数的组合以及模型对比实验,获得了较高的准确率,验证了模型的可行性和有效性。为社交网络文本危机情绪分类提供优化的理论模型和方法支持,同时为相关领域的研究提供语义资源。  相似文献   

9.
基于文本聚类与LDA相融合的微博主题检索模型研究   总被引:1,自引:0,他引:1  
伴随着微博的日趋流行,对微博信息的检索逐渐成为人们获取第一消息的手段.其中文本聚类和主题发现是信息检索领域的有效方法,采用适当的方法是影响微博短文本信息检索质量的关键因素.文章针对文本聚类和LDA主题模型的互补特征,综合考虑了微博特殊文体和短文本聚类效率问题,提出了基于频繁词集的文本聚类和基于类簇的LDA主题挖掘相融合的微博检索方法,给出了针对微博文体的一种新的主题检索模型.实验表明,该方法不仅能有效地划分微博文本,并且能清晰地挖掘类簇中潜在主题.  相似文献   

10.
研究了中文文本分类中的文本表示方法,提出了对中文文本表示因素的分析框架,并通过对3个数据集实验结果的分析,确定了各种文本表示因素对分类效果的影响.直接使用汉字进行划分也可以获得较好的分类效果;简单的不使用很大词库的分词和使用大词库的分词,以及复杂的分词对分类效果影响不大;仅使用01表示特征是否出现也可以获得比较好的分类效果;采用综合了合理的向量取值(如使用合适的归一化算法)可以较大幅度地提高分类准确率等.这些结论为后续的应用提供了指导原则.  相似文献   

11.
余本功  王胡燕 《情报科学》2021,39(7):99-107
【目的/意义】对互联网产生的大量文本数据进行有效分类,提高文本处理效率,为企业用户决策提供建 议。【方法/过程】针对传统的词向量特征嵌入无法获取一词多义,特征稀疏、特征提取困难等问题,本文提出了一种 基于句子特征的多通道层次特征文本分类模型(SFM-DCNN)。首先,该模型通过Bert句向量建模,将特征嵌入从 传统的词特征嵌入升级为句特征嵌入,有效获取一词多义、词语位置及词间联系等语义特征。其次,通过构建多通 道深度卷积模型,将句特征从多层级来获取隐藏特征,获取更接近原语义的特征。【结果/结论】采用三种不同的数 据对模型进行验证分析,采用对比相关的分类方法,SFM-DCNN模型准确率较其他模型分类性能有所提高,这说 明该模型具有一定的借鉴意义。【创新/局限】基于文本分类中存在的一词多义、特征稀疏问题,创新性地利用Bert来 抽取全局语义信息,并结合多通道深层卷积来获取局部层次特征,但限于时间和设备条件,模型没有进行进一步的 预训练,实验数据集不够充分。  相似文献   

12.
【目的/意义】基于互联网海量评论数据进行情报分析,挖掘出影响客户服务评价和满意度的关键因素,了 解客户差评背后的原因,对提升企业客户关系管理水平具有重要意义。【方法/过程】通过词云图、语义网络特征关 联分析、LDA主题模型的特征分析以及基于语义的情感词典方法,基于百度口碑中十家快递企业的客户评论数据 进行了情感计算与分析。【结果/结论】影响客户情感倾向的主要因素为:物流速度、服务态度、电话服务、投诉处理、 物流信息更新、时效性以及收费价格。基于上述结果提出了对策与建议。【创新/局限】基于现实世界真实数据,采 用数据挖掘方法分析客户情感倾向,为客户情感关键影响因素识别提供了数据科学的研究范式。  相似文献   

13.
[目的/意义]掌握和了解微博环境下高校舆情情感的演化规律,对相关部门加强高校舆情监测监管,使高校适时采取措施应对负面舆情事件的恶性传播具有十分重要的意义。[方法/过程]本文通过文本挖掘并利用词云可视化展示对文本特征进行分析;基于朴素贝叶斯分类器将网络用户评论文本进行情感分类;结合用户情感演化与舆情事件发展周期的分析动态展示高校舆情情感演化图谱。[结果/结论]网民负向情感的占比在舆情蔓延期达到顶峰,中性情感的占比在舆情蔓延期最低,正向情感的占比在舆情周期中几乎没有变化。通过对微博环境下高校舆情情感演化图谱进行研究,为微博环境下高校舆情的研究提供新的理论支撑,在实践层面为舆情监管部门及时监测和有效引导高校舆情走向起到针对性的作用。  相似文献   

14.
范昊  何灏 《情报科学》2022,40(6):90-97
【目的/意义】随着社交媒体的发展,各类新闻数量激增,舆情监测处理越来越重要,高效精确的识别舆情新 闻可以帮助有关部门及时搜集跟踪突发事件信息并处理,减小舆论对社会的影响。本文提出一种融合 BERT、 TEXTCNN、BILSTM的新闻标题文本分类模型,充分考虑词嵌入信息、文本特征和上下文信息,以提高新闻标题类 别识别的准确率。【方法/过程】将使用BERT生成的新闻标题文本向量输入到TEXTCNN提取特征,将TEXTCNN 的结果输入到 BILSTM 捕获新闻标题上下文信息,利用 softmax判断分类结果。【结果/结论】研究表明,本文提出的 融合了基于语言模型的 BERT、基于词向量 TEXTCNN 和基于上下文机制 BILSTM 三种算法的分类模型在准确 率、精确率、召回率和F1值均达到了0.92以上,而且具有良好的泛化能力,优于传统的文本分类模型。【创新/局限】 本文使用BERT进行词嵌入,同时进行特征提取和捕获上下文语义,模型识别新闻类别表现良好,但模型参数较多 向量维度较大对训练设备要求较高,同时数据类别只有10类,未对类别更多或类别更细化的数据进行实验。  相似文献   

15.
文本的观点倾向性判断一直都是自然语言处理领域内研究的热点问题。微博作为一种广泛应用的社交媒体,对其中用户表达的观点倾向判断有重要的的意义。本文采用机器学习对微博文本的倾向性的自动化判断进行研究,使用基于支持向量机SVM的方法对微博数据的观点倾向性进行分析预测,取得较好的结果。和基于词典的方法进行对比实验,各项指标都有提高。  相似文献   

16.
唐晓波  王洪艳 《情报杂志》2013,(2):107-111,127
微博平台上的产品评论是用户表达其产品需求和情感倾向的重要渠道。结合微博的社会性特点构建了一个微博产品评论挖掘模型,该模型在对产品评论进行情感极性分析的基础上,把不同极性的评论进行分类研究,通过统计分析的方法,挖掘用户关注的产品特征优缺点,并将对应观点的用户感知程度进行可视化;再根据微博产品评论的特点,通过共词网络分析方法实现了对产品竞争对象的识别与分析。最后,通过实证分析,验证了该模型的可行性。  相似文献   

17.
[目的/意义]用户生成内容有用性评价是自然语言处理研究的重要内容,文章提出一种融合领域情感词典与信息熵的评价方法,对体验型产品的用户生成内容有用性评价问题进行研究。[方法/过程]基于领域情感词典抽取用户评论语料的情感特征,并以信息熵作为信息量特征,以随机森林和梯度下降树分类模型进行对比实验,验证研究假设。[结果/结论]证明了体验型产品用户生成内容的有用性评价效果可以利用领域情感特征得到大幅提升,扩展了领域情感词典的实践应用场景。  相似文献   

18.
宁琳 《现代情报》2016,36(2):140
文本挖掘是数据挖掘技术的一个重要方面,本文根据句法规则的特征,利用文本挖掘技术,提出基于句法规则的文本知识挖掘设计模型,从数据准备、句法规则构造、文本预处理、文本知识挖掘、挖掘结果评价等方面对工作原理进行了分析,重点阐述了句法规则的构造过程,最后通过实验验证了该模型,该设计对实现文本知识的智能化挖掘具有一定的研究意义和应用价值。  相似文献   

19.
随着网络技术的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.常采用向量空间模型来表示文本,将文本看作特征空间的一个向量,使用TF·IDF方法对特征加权.但是这种加权方法简单地认为文本频数少的单词就重要,文本频数多的单词就不重要,使它不可能很好地反映单词的有用程度,从而导致分类准确率下降.针对TF·IDF方法存在的问题,提出了一种基于特征基尼指数的特征加权方法TF·GINI.实验结果显示,这种加权方法具有很好的分类性能.  相似文献   

20.
[目的/意义]为了解决因微博文本多义性和复杂性导致的谣言检测中语义特征提取不全面的问题,提出了一种结合微博内外多粒度语义的BiLSTM-CNN-ECA模型。[方法/过程]首先,对微博文本从字词句三个粒度级别建模,运用双向长短期记忆网络提取微博内部语义特征,生成事件字向量矩阵和事件词向量矩阵;然后,拼接事件句向量矩阵形成三维文本特征矩阵,输入多尺度卷积神经网络,并行提取微博之间的依赖关系特征;最后,引入高效通道注意力模块赋予通道权重,进行微博谣言检测。[结果/结论]构建的三维文本特征矩阵有机结合了各粒度文本的语义特征贡献,包含更多、更全面的微博语义信息;ECA可有效捕获通道间重要信息,进一步提高了多尺度CNN模型对谣言检测的准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号