首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
情感分类是自然语言处理的一个重要分支,情感分类方法包括传统的基于情感词典的方法和基于机器学习的方法,以及最新的基于深度学习的方法。为了探索情感分类的实现方法和研究进展,对传统的情感分类方法和基于深度学习的情感分类方法进行对比,并对深度学习LSTM原理进行了简要描述,可以发现基于深度学习的情感分类方法在情感分类上具有更大优势。  相似文献   

2.
深度学习是模拟人脑思维分层特点的一种机器学习方法。伴随深度学习技术在各领域的广泛应用,如何增强深度学习在中文复杂情感识别问题中的模型效果成为亟待解决的问题。文章通过梳理讽刺与其近义词之间的关系,提出了基于近义关系的讽刺定义,进而探讨了由讽刺定义模糊所导致的语料库质量问题,通过构建新语料库进行了讽刺规律探索,通过文本分类任务的对比试验,证明了基于近义关系的讽刺定义理论的有效性,并验证了注意力机制对于提取讽刺上下文信息的重要性。  相似文献   

3.
近年来,随着互联网和社交网络的发展,网络上文本信息迅速增长,对文本情感进行分析成为研究热点。根据文本情感分析方法的不同,总结了近年来文本情感分析的研究进展。将文本情感分析分为基于词典的方法和基于机器学习的方法两大类:基于词典的文本情感分析方法分为人工构建和自动构建两种;基于机器学习的文本情感分析方法分为基于贝叶斯算法、基于最大熵算法和基于SVM的文本情感分析3种。通过梳理国内外研究现状,对两类情感分析方法进行了深入分析,对文本情感分析进行了总结和展望。  相似文献   

4.
作为社交网络重要载体,微博成为信息传播的重要平台,承载着公众情感表达及舆论传播的重要功能。对微博博文及评论作出主题概括及情感分析在网络管控、舆情监测及公众情绪引导方面具有重要的实践意义。提出一种基于机器学习与文本分析的主题概括及情感分析模型。以武汉理工大学研究生坠亡事件为话题,利用Word2vec将文本转化为词向量,并且通过机器学习聚类方法对舆情各个生命周期过程进行主题概括,采用基于词典文本分析方法,对评论文本进行多元情感分析,对表现突出的情感大类作细粒度分析,最终实现基于主题与情感分析的多元细粒度公众情感变化分析模型。该分析模型可在特定舆情事件下得出公众在各阶段的关注中心及情绪变化规律,实现舆情主题与情感变化的协同演化研究。  相似文献   

5.
利用深度学习方法进行情感分析时,将文本作为一个整体进行编码,缺乏对表情符号与情感词的有效关注。而传统基于词典的方法则过分依赖于情感词典与判断规则的质量,不能充分考虑文本深层语义关系。针对该问题,构建融合表情符号与情感词的自注意力模型。通过BLSTM训练得到情感符号,并与文本特征向量融合,同时引入结构化自注意力机制识别文本中不同情感符号的情感信息。在NLPCC2014和微博公开语料数据集上的实验表明,相较传统情感分析方法,该模型可有效提高情感分类准确率。  相似文献   

6.
为了提高机器学习算法对手写字文本识别能力,克服个体手写字风格多变的干扰,设计了一种基于贝叶斯与生成式对抗网络的手写字文本识别算法。首先,建立10000个汉字的手写字数组头,每个汉字数组头后面依附100种手写体,构建起1000000帧汉字文本图像帧,作为后续学习训练的训练集数据输入。然后,利用贝叶斯线性模型,结合线性回归和先验分布,基于手写字图像样本数据库,进行有监督的机器学习训练,得到机器学习算子,完成针对手写字的粗识别。随后,根据生成式对抗网络原理,创建生成模型和判别模型,设计自适应潜在损失函数和迭代终止函数,解决深度学习普遍存在的过拟合问题,完成生成式对抗网络算子,完成针对手写字的深度识别。最后基于QTcreator开发的集成平台来实现所提算法的功能,其中,机器学习算子由OpenCV视觉函数实现,深度学习算子由TensorFlow框架实现。实验数据显示,相较于传统手写字识别算法而言,所提算法具有更高的手写字识别能力。  相似文献   

7.
情感分析在业界被广泛应用于产品分析、商品推荐等方面,具有很高的商业价值。目前常用的研究方法主要基于机器学习算法和基于词典的方法,该类方法通常需依赖复杂的人工规则和特征工程。针对传统情感分类方法需要人工干预的问题,总结目前已有可用于情感分析的深度学习方法,提出将卷积神经网络(CNN)和双向长短时记忆网络(BLSTM)进行组合,并将融合后的特征添加至注意力机制,设计出CBLSTM-Attention模型。实验表明,该模型在中文数据集上准确率达0.965 0,在NLPCC英文数据集上准确率达0.942 2,证明该方法不仅可提高文本情感倾向性分析的准确率,而且可有效解决人工干预问题。  相似文献   

8.
本文提出了一种基于主题采集的Web文档自动分类算法,该算法对朴素贝叶斯分类模型进行了改进。利用该算法,我们实现了一个基于主题信息采集的网页分类系统。文中着重对该系统的页面解析、中文分词和文本分类模块进行了论述,并对改进后的贝叶斯分类方法进行了评估。实验结果表明,该算法对网页分类有较高的准确性。  相似文献   

9.
随着信息技术的快速发展,深度学习算法在教育领域获得越来越广泛的认可。鉴于此,本文探讨了深度学习算法在小学语文阅读教学中的应用,包括文本分类、文本生成、语音识别、语音合成和问答系统等方面,并介绍了基于深度学习算法的小学语文阅读教学平台的案例,阐述了深度学习算法在小学语文阅读教学中的意义和价值及面临的挑战和发展。通过本文的探讨,我们可以更好地了解深度学习算法在小学语文阅读教学中的价值和意义。  相似文献   

10.
情感分析可以帮助商家了解客户喜好从而生产出满意度更高的商品,也可以监督网上舆论等。为此,基于传统机器学习方法,加入深度学习模块,对在线评论进行情感分析与对比。在词向量训练模块中引入Word2vec模型,用高维向量表示词语、句子,既可防止过度拟合问题,又可减少训练参数个数,提高训练效率。将得到的句向量作为输入代入机器学习模型(MLP、SVM、朴素贝叶斯等)与深度学习模型(CNN、LSTM、BILSTM等),比较实验结果,提出优化方向。结果表明,基于深度学习的情感分析模型准确率明显高于单一机器学习模型,但是深度学习需要大量语料,对实验机器要求也较高,很难完全展现其魅力。  相似文献   

11.
针对目前国内外学者对微博情感只作二分类研究,仅仅从正面和负面研究微博情感不足的问题,选取NLPCC2013-2014年多情感的微博数据集,重点研究常用的3种机器学习算法、3种特征选择以及特征权重方法对中文微博情感多分类的影响。实验表明:不管选择哪种特征权重,使用SVM的微博文本分类准确率都最高,KNN的准确率最低;不同特征权重下,信息增益作为特征选择的方法时,3个算法各自准确率都是最高的;当信息增益为特征选择,TF-IDF为特征权重时,支持向量机的文本分类准确率最高。由于微博简短、口语化,词袋模型忽视了词与词间的联系,导致微博情感分类准确率不高。  相似文献   

12.
针对当前基于LDA模型扩展的文本情感分析方法未能考虑同一词语在不同语境下其情感极性的差异及非特征情感词对微博文本情感极性的影响这两个问题,提出一种基于语境分类和遗传算法的微博情感分析方法。该方法首先利用LDA模型构造微博主题集及微博主题词集,然后用微博标签数据逐一对各微博主题词集应用遗传算法自动迭代计算得出词集中词语的情感值,最后利用词集词语的情感值计算微博文本情感极性。实验结果表明,该方法精确度比LDA提升3.12%,召回率达87.32%,F1达73.79%,能够从语境和非特征情感词获取微博情感信息,有效提高情感分类准确率。  相似文献   

13.
有监督的文本分类方法的研究与应用已经日渐成熟。提出了一种算法,针对大规模数据集进行无监督的文本分类,类似于潜在语义索引(LSI)的思想。首先,构建了用来表述主题分布的混合模型,再通过线性规划的方法计算每个文本的混合系数,然后利用混合系数对文本进行分类。最后,在arXiv文本集中对该算法进行了实验,结果显示分类效果比较理想。  相似文献   

14.
为了让学生用所学算法知识解决实际问题,设计了一个基于机器学习算法的舆情分析案例。以电影《战狼2》的影评分析为例,通过词云图分析数据的一般规律,然后利用时间序列和文本聚类方法对舆情进行分析。分析结果显示,观众的情感倾向及关注度短期内不会有较大的变化,且与具体的情景息息相关。  相似文献   

15.
SVM(Support Vector Machine,支持向量机)是由Vapnik等人提出的一种新的机器学习方法。以结构误差理论、条件二次优化理论与核空间理论作为理论基础,能够较地的解决机器学习的问题,如模型选择、过学习、非线性问题和灾难维数等,很适合应用在文本分类领域。针对文本分类技术的新问题,研究了已有的主动学习方法并对其进行改进,提出了一种新的主动学习算法,很好地解决了小规模标注样本集的分类问题。该方法尤其在难以获得大量类标签或者标注样本耗费较大的领域,更能显示出它的优越性,适合日新月异的互联网的应用。  相似文献   

16.
基于统计的传统无监督机器学习识别分类技术虽经持续改进对于高分遥感图像效果仍不佳,深度学习具备仿人类神经网络多层抽象能力和无监督自学习特点,具有从大量无标签高光谱遥感数据中自主学习和构建其特征的能力,再结合常用分类算法进行识别分类,比传统方法具有相对更高的准确率.  相似文献   

17.
微博情感分析是当今情感分析的一大研究热点,中文微博情感分析按照处理层面的不同可以分为主题无关和主题相关分析,分析方法主要分为两类,一是基于情感词典的方法,另一类是基于机器学习的方法.本文对目前中文微博情感分析的主要流程和处理方法进行了探讨,对两类方法的特点及其研究现状进行了分析、比较,对不能完全准确进行情感分类的主要原因进行了归纳总结,为情感分析方法的进一步研究提供了参考方向.  相似文献   

18.
为弥补目前国内学者只做单一算法研究且语料单一的缺陷,使用Word2vec词向量模型结合支持向量机(SVM)、卷积神经网络(CNN)和长短期记忆网络(LSTM)3种不同分类算法,研究了不同中文文本分类问题,包括微博语料的多维细粒度情感分类、酒店评价的倾向性分析和新闻文本的主题分类。将3种分类模型在不同文本中的分类效果进行对比,结果显示这3种算法对于不同的中文分类效果各有不同:不同维度的词向量对准确率等评价指标影响很大;支持向量机模型更适合于细粒度的微博情感分类;卷积神经网络、长短期记忆网络算法更适合于噪声小、文本长且规范的新闻主题分类任务。分类粒度会对算法准确性产生影响,粒度越细、任务越复杂,算法准确性越低。  相似文献   

19.
低年级语文课堂基于识字写字,对课文的阅读理解比较浅显,鲜见基于文本的语言表达和主题意义上的“双线”迁移和应用。学生学习课文,为了识字而识字,不知道文本与自身有什么关系。部分低语课堂缺少对文章语言特点、主题内容和人文价值的有效利用,没有最大限度地发掘教材的育人价值和言语内化功能。如何搭建多元支架,深入浅出,导向深度学习,发挥学科育人的功能?笔者基于二(下)课文《我是一只小虫子》,进行了积极有效的实践。从搭建多元支架的角度出发,基于儿童特点,合理解读文本,实现文本语言、主题、结构的“三维联动”。学生在读中仿说,促进思维的整体发展,导向低年级语文课堂的深度学习,提高学生的语文素养。  相似文献   

20.
文本分类是文本数据挖掘领域的重要技术之一。从分类算法对文本语义信息的利用程度这一角度出发,将文本分类划分为基于词形的算法和基于语义的算法两类,对每类算法进行了描述,并对当今文本数据的多样性及文本分类算法改进的可选方向进行了研究。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号