首页 | 本学科首页   官方微博 | 高级检索  
     检索      

停用词表对中文文本情感分类的影响
引用本文:王素格,魏英杰.停用词表对中文文本情感分类的影响[J].情报学报,2008,27(2):175-179.
作者姓名:王素格  魏英杰
作者单位:1. 山西大学数学科学学院,太原,030006;上海大学计算机工程与科学学院,上海,200436
2. 山西大学数学科学学院,太原,030006
基金项目:国家自然科学基金 , 山西省自然科学基金 , 山西省科技攻关项目 , 山西高校科技研究开发项目
摘    要:本文利用三种特征选择方法、两种权重计算方法、五种停用词表以及支持向量机分类器对汽车语料的文本情感类别进行了研究.实验结果表明,不同特征选择方法、权重计算以及停用词表,对文本情感分类的影响也不尽相同;除形容词、动词和副词外的其余词语作为停用词表以及不使用停用词表对情感分类作用较大,得到的分类结果比较好;总体上,采用信息增益和布尔型权重进行中文文本情感分类的效果较好.

关 键 词:停用词  文本情感分类  特征选择  支持向量机
修稿时间:2007年2月9日

The Influence of Stoplist on the Chinese Text Sentiment Categorization
Wang Suge,Wei Yingjie.The Influence of Stoplist on the Chinese Text Sentiment Categorization[J].Journal of the China Society for Scientific andTechnical Information,2008,27(2):175-179.
Authors:Wang Suge  Wei Yingjie
Institution:Wang Suge~(1,2) Wei Yingjie~1 (1.School of Mathematics Science,Shanxi University,Taiyuan 030006,2.School of Computer Engineering , Science,Shanghai University,Shanghai 200072)
Abstract:In this paper,using three kinds of feature selection methods,two kinds weighing assignment methods,the five kinds of Stoplist and SVM on text sentiment classification are studied.The experiment results indicate that the greater text sentiment classification impact depends on other corpus,excluded adjective,verb,adverb as stop words and none stop words.As a whole,for text sentiment classification,information gain is superior to other feature selection methods and Boolean type weighting is superior to frequen...
Keywords:stop word  text sentiment classification  feature selection  support vector machine  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号