首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
基于修正点互信息的特征级情感词极性自动研判   总被引:1,自引:0,他引:1  
[目的/意义]基于语料的情感词发现依语句上下文推断情感词极性,能显著提升情感分析的准确率,在面向领域的特征级情感分析任务中有重要应用价值。[方法/过程]对特征级情感极性研判问题展开探讨,提出基于点互信息的"特征-情感"对情感极性自动判别算法,算法借助大规模领域语料,根据观点表达"特征-情感"对与情感语义明确的种子词的共现关系,同时引入依存句法分析语句间的情感转折,通过修正经典的点互信息算法,对上下文约束下的用户观点表达进行褒贬预测。[结果/结论]实验证明,修正算法的性能显著优于词典匹配算法和经典的点互信息情感识别算法,不仅能够推断词典中未纳入的观点表达的情感指向,而且能较准确地推断"语境"中的情感词极性。在餐饮评论和数码产品评论两个评测语料集上,修正算法的F1宏平均指标分别达到0.827和0.878。该算法以领域相关的大规模语料为支撑,基于概率统计和句法分析,因数据获取便利,算法效率高,移植性好,具有普适性,尤其适用于面向领域的情感分析任务。  相似文献   

2.
一种基于句法分析的情感标签抽取方法   总被引:1,自引:0,他引:1  
指出情感标签由评价对象和情感词组成,包含评论的关键要素,能清楚地表达评价者的观点意见。提出一种针对产品网络评论的情感标签抽取模型,利用依存句法分析设计情感标签抽取算法,通过情感极性计算对抽取出的情感标签进行过滤。通过放宽的抽取规则与情感极性过滤相结合,以提高情感标签的召回率,实现潜在评价对象的抽取。最后用网络抓取的产品评论语料作为测试数据集对模型进行测试,获得较高的抽取准确率和召回率,并对模型中存在的问题进行总结,作为模型改善的指导。  相似文献   

3.
句子情感分析及其关键问题   总被引:2,自引:0,他引:2  
情感分析关注具有情感倾向的评价性信息,具有广泛的应用。情感分析按照粒度的不同分为三种:词汇情感分析、句子情感分析和文档情感分析。文中对句子情感分析及其关键问题进行介绍,首先简要描述句子情感分析的任务,然后介绍句子情感分析中主客观句分类方法及两种主观句情感分类方法--基于情感词的方法和机器学习方法,最后对情感分析中的三个关键问题--词汇上下文极性判定、评价主题识别、意见持有者识别进行总结。  相似文献   

4.
通常用于评论性文本极性挖掘的方法是采用有监督的学习算法完成的,但有监督的学习算法需要大量人工标注的训练集,而且其在处理文本集时还会面临维数灾难、稀疏向量、高时空复杂度、低召回率和精确率等问题而无法用于海量的文本极性分类任务。经典的K-means均值聚类算法是聚类分析中使用最为广泛的算法之一,其具有诸多的优良特性和不足。针对上述情况,本文将语义引入经典K-means均值聚类算法中,构造了专门针对中文评论文本极性判断的极性词语义词典,提出了一种基于语义准则函数的K-means均值聚类算法。这项研究是运用基于语义的聚类方法对汉语主观性文本处理的一次探索。实验结果显示总平均召回率达到了80.70%,总平均精确率达到了67.75%,说明该算法是可行和有效的。  相似文献   

5.
[目的/意义] 微博平台产品评论的特征级情感分析问题具有其特殊性,为了对特征分类,解决隐式特征的识别问题,并分析特征情感,提出一种基于特征本体的产品评论情感分析方法。[方法/过程] 该方法利用构建的特征本体对特征词分类,通过计算情感词与特征的搭配权重来识别隐式特征,并构建领域情感词典和微博表情符号词典,计算微博产品评论的特征情感极性和强度。[结果/结论] 构建方法模型,通过采集微博评论数据设计实验,验证了提出方法的有效性。  相似文献   

6.
本文从句子级的角度进行了中文文本的情感倾向分析,提出以HowNet中的情感词表为种子情感词集,采用基于CRF模型的半监督学习迭代方法获取大量评价词,然后依据中文词间的语义规则判断句子的极性的方法.将该方法应用于COAE2011中任务2-观点句识别,在评价词的识别和观点句极性判断都取得了很好的结果.  相似文献   

7.
Study on Construction of Fuzzy Emotion Ontology Based on HowNet   总被引:1,自引:0,他引:1  
构建模糊情感本体是在线评论情感分析的基础.针对在线评论情感表达的多样性和模糊性,将情感本体划分为评价词本体和情感词本体,利用模糊理论和知网相关概念,构建模糊情感本体的基本模型.根据评价词和情感词的各自特点,运用模糊化处理和语义相似度的相关理论,分别对评价词模糊本体和情感词模糊本体的情感类型和隶属度进行了相应处理.并通过与点互信息方法比较,验证了情感本体模型在自动获取情感类方面的有效性,最后进行了相关数据统计.  相似文献   

8.
由于自然语言的复杂性,使得情感挖掘仍存在一些问题需要解决,如情感词的领域依赖性、隐式特征识别、同指特征处理和特征极性计算等。为解决这些问题,提出一种基于语义的情感挖掘方法,该方法以主题图为指导进行特征及情感词的识别和情感极性强度计算,充分利用特征之间及其特征与情感词之间的语义关系,可以在一定程度上提高意见挖掘的准确性。  相似文献   

9.
中文文本情感倾向分析研究   总被引:2,自引:0,他引:2  
文章首先采用文献计量的方法,统计分析了中文文本情感领域相关的研究论文并给出当前研究框架;接着分类研究了中文文本情感分析的代表性成果,按基础理论研究和应用研究两部分进行深入探讨,前者包括词语和文档情感极性判断、细粒度情感信息抽取、情感分析资源建设,后者则包括其在各领域的应用研究及相关商业系统;最后对中文文本情感倾向分析进行了展望。  相似文献   

10.
[目的/意义]探索热点事件评论网络中话题社群及网民的情感波动,掌握舆情事件发展过程,对于整体把握热点事件的发展方向,做好新时期网络舆论的引导工作具有重大意义。[方法/过程]以复杂网络理论为基础,基于评论词语间的共现关系构建基于事件发展的子事件网络,通过社群发现算法来识别子事件评论网络中的话题社群,将情感词依据情感词典赋予情感分类属性,基于事件的演化过程动态地跟踪网民意见以及情感波动。[结果/结论]研究结果表明,评论网络群落发现以及变异系数方法可以有效地衡量网民话题讨论的规模与集中程度;评论网络中赋予情感词节点情感分类属性方法可以体现事件演化过程中网民的情感变化;舆论衍生话题对事件的舆情发展有持续性影响;网民话题讨论内容对于事件演化具有一定程度上的前瞻性。  相似文献   

11.
提出维吾尔语情感语料库的构建规范,设计和实现维吾尔语情感语料库辅助整理系统。该系统结合维吾尔语情感语料的具体特点,多方面分析维吾尔语情感词汇的特征,利用条件随机场(CRFs)模型进行维吾尔语情感词汇的自动识别。测试结果验证该系统能够大幅度降低人工劳动,高效快速地标注维吾尔语情感词语料。  相似文献   

12.
[目的/意义]随着网络新闻的广泛快速传播,通过辨析网络新词,及时掌握新闻热点关键词,对于了解新闻热点和社会舆情的预警控制具有十分重要的意义。[方法/过程]利用改进的关联规则算法对网络新闻标题进行挖掘,相邻、有序地输出频繁字符串集合。根据互信息计算字符串的相似度,形成热点新闻的关键词集合,以实际的网络新闻为语料进行实验。[结果/结论]实验结果表明,本文所提出的方法不仅能有效地发现词典中不存在的新词汇以及当前网络中流行的热词,而且有效地区别词汇集合中的复合式新词,继而可通过热词集合的热点度计算对网络新闻热点进行排名。  相似文献   

13.
孙文峥 《编辑之友》2018,(5):61-65,70
网络语言正日益成为当代青少年情感传达和表征的重要文化符号.文章旨在探讨当网络语言经由数字化传媒的高强辐射性嵌入青少年的日常生活后,青少年情感体验的迁移与改变.研究发现,网络语言使情感的表达方式呈现出"横宽纵短"的扁平化特征.以扁平化的内涵意蕴参照青少年日常生活中网络语言情感表达时,发现其呈现出一系列矛盾特质:一方面,青少年依据全新的情感逻辑权衡情感分寸,敏锐捕捉生活中的谐趣和夸张,灵活调度丰富的情感表征储备;另一方面,对于情感的洞悉、情感虚实空间的转换和嫁接,青少年不可避免地产生了陌生和弱化.这一看似对立的特质相互依傍和制衡,产生出持续的张力,使得青少年的情感体验在互联空间中呈现出"割裂的扁平化".  相似文献   

14.
[目的/意义] 针对目前全领域科学知识图谱构建方法中存在的技术难点,结合网络嵌入模型、机器学习聚类、流形学习可视化算法等人工智能领域的方法与模型,提出一套全新发现科学结构的知识图谱构建方案,以完善科学结构发现与可视化布局,并拓展科学知识图谱的分析应用场景。[方法/过程] 引入基于深度学习的网络嵌入模型和聚类方法改进原有的网络社团划分聚类方法,利用流形学习降维可视化算法扩大数据处理能力,并设计由下至上分层可视化布局方法,提升可视化图谱的稳定性与细节揭示能力。[结果/结论] 以科睿唯安公司的基本科学指标数据库(ESI)研究前沿中高被引论文作为分析数据集,使用新聚类算法得到1 169个研究领域,通过改进的可视化布局算法形成全领域科学结构图谱。与前几期科学结构图谱相比,本文提出的方法支持更大规模的数据分析,对可视化细节揭示与稳定性也有大幅优化,可以更好地展示全领域科学研究宏观结构及内在关系,为全领域科学知识图谱的绘制与构建提供更可靠的方法和技术支持。  相似文献   

15.
本文分析了搜索引擎和后控词表结合的可能性,探讨了网络后控词表的编制方式、词表结构、词表管理和新词推荐算法等理论。根据这些理论,结合网络资源和网络搜索引擎的特点,设计了一个网络后控词表系统。笔者使用Java语言实现了这一后控词表系统的功能。最后笔者通过实验对本系统进行了评价,并提出网络后控词表的研究方向。  相似文献   

16.
从社会建构论的角度来看,人的情绪虽然以生物性反应为基础,但主要是社会建构的结果。文化和语言是建构情绪的重要手段。个体情绪借助语言在社会网络间传播,实质是一场以情绪理解为内核的群体情感互动仪式。互联网群体传播帮助人们通过建立弱关系扩大社会网络,促进个体情绪在传播范围上的量变和情绪性质上的质变,形成社会情绪型舆论。网络语言具有表层和深层双重情绪基因,通过模因复制进行群体传播。在此过程中,网络语言具有三重效应:一是凝合效应,促进深层情绪整合,形成社会舆论;二是转移效应,其表层的娱乐性、游戏性特征能推动情绪转化,疏导社会舆论;三是沉淀效应,累积社会情绪氛围,沉淀社会参与基因,建构网络语言所诞生和维护的社会文化。  相似文献   

17.
[目的/意义]借助信息扩散研究方法,对伴随文化内容传播的社交媒体热点这一特殊类型事件中的民族文化演化扩散规律进行探究,为解释民族文化扩散规律、推动民族文化传播提供新视角。[方法/过程]以微博平台“丁真事件”发布文本为数据来源。基于LDA主题模型、民族文化符号识别与情感分析构建主题—民族文化符号—情感关联网络,对热点事件中不同主题传播伴随的民族文化演化扩散动态进行情境还原。量化不同类型用户的民族文化传播影响力,探究热点事件中不同主体的民族文化传递接力过程。[结果/结论]结果表明,从主题—民族文化符号—情感关联网络构建与传播主体影响力两大层次分析社交媒体情境下民族文化扩散路径规律,可帮助人文学者精准把握文化传播细节及其动态交互特征。  相似文献   

18.
[目的/意义]借助信息扩散研究方法,对伴随文化内容传播的社交媒体热点这一特殊类型事件中的民族文化演化扩散规律进行探究,为解释民族文化扩散规律、推动民族文化传播提供新视角。[方法/过程]以微博平台“丁真事件”发布文本为数据来源。基于LDA主题模型、民族文化符号识别与情感分析构建主题—民族文化符号—情感关联网络,对热点事件中不同主题传播伴随的民族文化演化扩散动态进行情境还原。量化不同类型用户的民族文化传播影响力,探究热点事件中不同主体的民族文化传递接力过程。[结果/结论]结果表明,从主题—民族文化符号—情感关联网络构建与传播主体影响力两大层次分析社交媒体情境下民族文化扩散路径规律,可帮助人文学者精准把握文化传播细节及其动态交互特征。  相似文献   

19.
文章明晰技术功效间的多种语义联系,设计技术实现路径的自动化构建方法,实现其即时更新和可视化。结合专利数据特点,基于规则从专利标题中抽取技术词,利用BiLSTM-CRF深度学习模型从专利摘要中抽取专利功效短语,并设计规则从功效短语中自动识别出功效词以及表示技术功效间语义联系的关系词,构建“技术词-关系词-功效词”结构的技术功效语义关联,通过计算实体间语义相似度实现技术词对齐和功效词对齐,优化技术功效关联,依此构建技术实现路径,并以知识网络的形式对其进行可视化。在5G技术领域的实证结果表明,该方法能有效揭示技术功效间的多种语义联系和自动构建技术实现路径,并实现路径的即时更新和清晰展示。  相似文献   

20.
基于引文内容分析的引用情感识别研究   总被引:1,自引:0,他引:1  
[目的/意义]针对自动识别论文引用情感问题,提出一种基于引文内容分析的识别方法并进行可视化展示,克服基于简单引用频次计量无法区分不同引用情感的问题。[方法/过程]首先,利用正则表达式抽取出论文全文中的引文内容信息;然后,利用TF-IDF算法筛选出引用情感特征词,结合情感词典,利用情感分析技术对引文内容进行引用情感识别;最后,利用可视化工具展示出引用情感整体分布情况。[结果/结论]该方法能够有效识别出抗衰老领域论文数据集中引用情感情况。实验结果显示,该领域正面引用占总引用次数的21%,中立引用占总引用次数的78%,负面引用仅占总引用次数的1%。与传统引文网络相比较,基于引用情感的可视化图谱可以有效识别出不同引用情感在整体数据集合上的分布情况。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号