首页 | 本学科首页   官方微博 | 高级检索  
     检索      

数据清洗研究综述
引用本文:王曰芬,章成志,张蓓蓓,吴婷婷.数据清洗研究综述[J].现代图书情报技术,2007,2(12):50-56.
作者姓名:王曰芬  章成志  张蓓蓓  吴婷婷
作者单位:1. 南京理工大学经济管理学院,南京,210094;万方数据研究院-南京理工大学"企业创新服务联合实验室",南京,210094
2. 南京理工大学经济管理学院,南京,210094;万方数据研究院-南京理工大学"企业创新服务联合实验室",南京,210094;中国科学技术信息研究所,北京,100038
摘    要:对数据清洗问题进行综述。介绍数据清洗问题产生的背景和国内外研究现状。给出数据清洗的定义和对象,说明数据清洗的基本原理、模型,分析相关算法与工具,给出数据清洗评估方法;并对今后数据清洗的研究和应用进行展望。

关 键 词:数据清洗  数据质量  重复记录检测  异常数据检测
收稿时间:2007-09-17
修稿时间:2007年9月17日

A Survey of Data Cleaning
Wang Yuefen,Zhang Chengzhi,Zhang Beibei,Wu Tingting.A Survey of Data Cleaning[J].New Technology of Library and Information Service,2007,2(12):50-56.
Authors:Wang Yuefen  Zhang Chengzhi  Zhang Beibei  Wu Tingting
Institution:1(Department of Information Management, Nanjing University of Science & Technology, Nanjing 210094,China) 2(Laboratory for Enterprise Innovation Service, Nanjing University of Science & Technology, Nanjing 210094,China) 3(Institute of Scientific & Technical Information of China, Beijing 100038,China)
Abstract:Data cleaning problem is surveyed in this paper.Firstly,the background of data cleaning problem and research status is explained.Then,the definition and objects of data cleaning are given.The basic principle and some models of data cleaning are presented.Related algorithms and tools are analyzed and evaluation methods of data cleaning are proposed.Finally,the future research topics and application related to data cleaning problems are discussed.
Keywords:Data cleaning Data quality Duplicate record detect Outlier data detect
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《现代图书情报技术》浏览原始摘要信息
点击此处可从《现代图书情报技术》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号