首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种基于自组织神经网络的中文文本聚类新方法
引用本文:徐建锁,王正欧,王莉.一种基于自组织神经网络的中文文本聚类新方法[J].情报学报,2003,22(6):676-680.
作者姓名:徐建锁  王正欧  王莉
作者单位:天津大学系统工程研究所,天津,300072
基金项目:国家自然科学基金资助项目 (6 0 2 75 0 2 0 )
摘    要:针对传统K—均值等算法在文本聚类中的缺陷 ,本文提出了一种树形动态自组织映射 (TGSOM)神经网络来实现中文文本聚类 ,克服了传统的K—均值等算法中文本种类需要预先给定的缺点。本文详尽描述了该网络模型的生成算法和算法中扩展因子的作用 ,并阐述了中文文本的数字化方法———TF .IDF .IG方法

关 键 词:文本聚类  特征提取  信息增益  神经网络  自组织特征映射
修稿时间:2003年1月2日

A Novel Approach of Chinese Text Clustering Based on Self-Organizing Neural Network
Xu Jiansuo,Wang Zheng''''ou and Wang Li.A Novel Approach of Chinese Text Clustering Based on Self-Organizing Neural Network[J].Journal of the China Society for Scientific andTechnical Information,2003,22(6):676-680.
Authors:Xu Jiansuo  Wang Zheng'ou and Wang Li
Abstract:Traditional methods of text clustering have the defect in that the number of kinds must be given before text clustering. This paper applies TGSOM(tree-structured growing self-organizing map) algorithm to clustering Chinese text, and remedies the defect of traditional methods. The TGSOM algorithm and the function of a spread factor are presented in detail. An approach of calculating term weight is expounded.
Keywords:text clustering  feature selection  information gain  neural networks  self-organizing feature maps  SOFM  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号