首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种面向中文产品评论数据的情感分类模型
引用本文:李洋,马健新.一种面向中文产品评论数据的情感分类模型[J].滨州学院学报,2016(6):72-78.
作者姓名:李洋  马健新
作者单位:北京邮电大学 电子工程学院,北京,100876
摘    要:对具有字数少、噪声多、特征稀疏等特点的中文产品评论数据建立了一种基于机器学习的情感分类模型,旨在提高情感倾向性判别的综合评价指标F值。结合知网(HowNet)情感词典提出了一种通过增加情感词比重的C-TF-IDF权重计算方法,弥补了词频-逆向文档频率IF-IDF仅依靠词频来衡量特征项权重的缺点。先对一步三分法和二步二分法的情感分类策略进行了实验对比分析;然后选取了一步三分法对不同特征提取数量下的情感分类效果进行了研究。实验结果表明,C-TF-IDF比TF-IDF更适合于中文产品评论数据的情感分类任务,F值可最低提高1.584%,最大提高2.267%。

关 键 词:中文产品评论数据  情感分类  机器学习  知网  TF-IDF  F值

A Kind of Sentiment Classification Model for Chinese Product Comment Data
LI Yang,MA Jian-xin.A Kind of Sentiment Classification Model for Chinese Product Comment Data[J].Journal of Binzhou University,2016(6):72-78.
Authors:LI Yang  MA Jian-xin
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号