首页 | 本学科首页   官方微博 | 高级检索  
     检索      

Web自动文本分类技术研究综述
引用本文:蒲筱哥.Web自动文本分类技术研究综述[J].情报学报,2009,28(2).
作者姓名:蒲筱哥
作者单位:徐州师范大学图书馆,徐州,221116
摘    要:Web自动文本分类是信息检索与数据挖掘领域的研究热点与核心技术,近年来得到了广泛的关注和快速的发展.本文首先分析了国内外Web自动文本分类方法的研究现状,接着对新近出现的多分类器融合的方法、基于群的分类方法、基于RBF网络的文本分类模型、基于模糊-粗糙集的文本分类模型、潜在语义分类模型等新方法,以及K-近邻算法和支持向量机的新发展等进行了深入探讨;并对Web自动文本分类过程中的几个关键技术:文本预处理、文本表示、特征降维、训练方法和分类算法等进行了分析;最后总结了当前Web自动文本分类技术存在的问题及其发展趋势.

关 键 词:文本分类  分类方法  文本表示  特征选择

A Literature Review on Web Automated Text Categorization Technology
Pu Xiaoge.A Literature Review on Web Automated Text Categorization Technology[J].Journal of the China Society for Scientific andTechnical Information,2009,28(2).
Authors:Pu Xiaoge
Institution:Library of Xuzhou Normal University;Xuzhou 221116
Abstract:In recent years,there have been extensive studies and rapid progresses in automated text categorization,which is one of the hotspots and key techniques in the information retrieval and data mining field.This article has analyzed the research present situation of domestic and foreign Web text categorization method firstly,has analyzed the new methods which recently appeared,swarm-based approaches,based on the fuzzy-rough collection text classification model,the multi-sorters fusion method,based on RBF networ...
Keywords:text categorization  categorization method  text representation  feature selection  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号