首页 | 本学科首页   官方微博 | 高级检索  
     检索      

停用词表对基于SVM的中文文本情感分类的影响
引用本文:夏火松,陶敏,王一,魏翔.停用词表对基于SVM的中文文本情感分类的影响[J].情报学报,2011,30(4).
作者姓名:夏火松  陶敏  王一  魏翔
作者单位:1. 武汉科技学院经济管理学院,武汉,430073
2. 武汉科技学院经济管理学院,武汉430073;武汉科技学院商务智能与数据挖掘实验室,武汉430073
基金项目:国家社会科学基金(07BTQ010); 湖北省课题(Z20091701,2008d062,2008244,2007097,HB092-21); 武汉市课题(200940833384-02,20041007072-08); 中国纺织工业协会(2007082)支持
摘    要:运用非结构化信息挖掘,对网络评论情感进行分析是一个非常重要的方法。本文基于Web客户评论情感文本,在情感文本预处理过程中使用四种不同的停用词表,采用两种不同的特征选择方法,选用著名的TF-IDF权重计算方法,使用基于RBF核函数的支持向量机方法的分类器实现了对携程网上采集的4000个酒店客户评论情感文本的分类研究。通过实验,分析了不同特征选择方和停用词表的使用对客户评论文本情感分类的影响,提出了基于情感文本分类的有效的停用词表。

关 键 词:客户评论  情感分类  停用词表  特征选择  支持向量机  

The Influence of Stop Word Removal on the Chinese Text Sentiment Classification Based on SVM Technology
Xia Huosong,Tao Min,Wang Yi,Wei Xiang.The Influence of Stop Word Removal on the Chinese Text Sentiment Classification Based on SVM Technology[J].Journal of the China Society for Scientific andTechnical Information,2011,30(4).
Authors:Xia Huosong  Tao Min  Wang Yi  Wei Xiang
Institution:Xia Huosong~1,Tao Min~(1,2),Wang Yi~(1,2) and Wei Xiang~1 (1.Department of economics and management,Wuhan University of Science and Engineering,Wuhan 430073,2.Business Intelligence and Data Mining Lab WUSE,Wuhan 430073)
Abstract:It is an important method to analyse Web reviews' sentiment categorization with unstructured information date mining.This paper based on the Web text reviews,using four different kinds of stop word removal way,two kinds of feature selection methods,the famous TF-IDF weighing assignment methods and the SVM(support vector machine) technology with the RBF kernel function categorize the 4,000 customer reviews text grasp on XIECHENG.With the results of the experiment,this paper analysis the influence of differen...
Keywords:customer review  sentiment classification  stop words removal  feature selection  support vector machine  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号