首页 | 本学科首页   官方微博 | 高级检索  
     检索      

自组织映射在专利文本聚类中的应用研究
引用本文:曲军伟,乔晓东,桂婕.自组织映射在专利文本聚类中的应用研究[J].数字图书馆论坛,2010(9):13-19.
作者姓名:曲军伟  乔晓东  桂婕
作者单位:中国科学技术信息研究所,北京,100038
基金项目:国家科技部"十一五"科技支撑计划,中国科学技术信息研究所重点工作项目,中国科学技术信息研究所2009年度预研基金项目(项目 
摘    要:自组织映射(SOM)是一种基于人工神经网络的聚类方法,通过将相似的输入数据映射到相同或者相近神经元达到相似相聚的目的,有着不需要先验知识、保持拓扑结构不变、无监督自我学习和易于可视化的优点。由于专利文献有着数量大、文字晦涩冗长、专业性强等特点,分析难度较大,自动聚类分析能挖掘专利文献内在相似性,作为基础性处理用于后期应用,例如专利数据清洗、专利检索、主题分析和专利地图生成等众多领域。基于SOM的专利文本聚类与传统聚类方法相比效率和准确率较高,并且易于可视化展示。本文使用了SOM、k-means和TwoStep算法分别在专利文本聚类中作了对比,得出SOM较优的结论。

关 键 词:自组织映射  专利聚类  文本挖掘  可视化

A Research on Patent Document Clustering-analysis Using Self-Organizing Map
Qu Junwei,Qiao Xiaodong,Gui Jie.A Research on Patent Document Clustering-analysis Using Self-Organizing Map[J].Digital Library Forum,2010(9):13-19.
Authors:Qu Junwei  Qiao Xiaodong  Gui Jie
Institution:( Institute of Scientific and Technical Information of China, Beijing, 100038)
Abstract:Self-Organizing Map (SOM) is a method for clustering based on ANN, which maps the similar data to the same or close neurons in order to categorize the inputs. SOM has several advantages: requidng no prior knowledge, topological structure mapping, unsupervised, visualization, etc. Using SOM, the patent document clustering is easier, more automatic and efficient.
Keywords:SOM  Patent clustering  Text mining  Visualization
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号