首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于树距离规范化的专利聚类方法
引用本文:胡侠,林晔,汪亮,盛夏,王灿.基于树距离规范化的专利聚类方法[J].情报学报,2012,31(11).
作者姓名:胡侠  林晔  汪亮  盛夏  王灿
作者单位:1. 杭州市科技信息研究院,杭州,310001
2. 浙江大学计算机学院,杭州,310027
摘    要:专利数据包含了各种丰富的信息.通过对专利数据聚类,可以将它们划分为语义或结构上相似的子集,从而为发现数据中所蕴含的有用模式和知识提供更为深入的洞察力.传统的专利数据聚类方法通常只是利用专利数据的某项属性实现聚类,没有充分利用专利数据所包含的多种丰富信息.本文针对现有专利数据聚类方法的不足,提出了一种综合利用专利摘要文本和IPC分类号的专利聚类方法PDICluster.该方法通过解析IPC分类号中包含的树型结构信息,利用树距离度量专利数据之间的相似性,并综合专利摘要文本和IPC分类号相似性信息来实现专利数据聚类.实际专利数据上的聚类实验结果验证了PDICluster方法的有效性.

关 键 词:专利聚类  专利分析  IP  C树距离

Patent Data Clustering Based on Tree-distance Regularized
Hu Xia , Lin Ye , Wang Liang , Sheng Xia , Wang Can.Patent Data Clustering Based on Tree-distance Regularized[J].Journal of the China Society for Scientific andTechnical Information,2012,31(11).
Authors:Hu Xia  Lin Ye  Wang Liang  Sheng Xia  Wang Can
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号