首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于数据挖掘的专利数据预处理系统的设计与实现
引用本文:赵蕴华,张静.基于数据挖掘的专利数据预处理系统的设计与实现[J].情报科学,2011(12).
作者姓名:赵蕴华  张静
作者单位:中国科学技术信息研究所;
基金项目:科技部重大专项基金项目(2009FY240100)
摘    要:本文针对当前专利数据预处理中存在的处理效率低、耗费资源量大、处理准确度不高的问题,结合数据挖掘中预处理技术,以欧洲专利局文献管理数据库(DOCDB)专利数据为例,设计并实现了DOCDB专利数据的预处理系统。该系统能够对DOCDB专利数据文件的结构进行解析,提取相关的专利信息,并将处理后的数据存入数据库中。实验结果表明,该系统能够高效处理专利数据,有力的提高了专利预处理的自动化水平。

关 键 词:数据挖掘  数据预处理  专利分类  DOCDB  

Design and Implemention of Patent Data Preprocessing System Based on Data Mining Theory
ZHAO Wun-hua,ZHANG Jing.Design and Implemention of Patent Data Preprocessing System Based on Data Mining Theory[J].Information Science,2011(12).
Authors:ZHAO Wun-hua  ZHANG Jing
Institution:ZHAO Wun-hua,ZHANG Jing(Institute of Scientifice Technical Information of China,Beijing 100038,China)
Abstract:In order to improve efficiency and accuracy of patent information preprocessing,according to data preprocessing methods of data mining theory,we designed and develop Patent Information Preprocessing System to preprocessing DOCDB information(Patent bibliographic information in XML format from European Patents Organization).It can parse DOCDB information,extract and reorganize important patent attributes,and load processed patent information into database system.The experimental results show that our Patent I...
Keywords:data mining  data preprocessing  patent classification  DOCDB  
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号