首页 | 本学科首页   官方微博 | 高级检索  
     检索      

WEB文本海量数据挖掘应用中的多点数据采集及处理问题研究
引用本文:曾锡山,胡俊荣.WEB文本海量数据挖掘应用中的多点数据采集及处理问题研究[J].情报杂志,2010,29(8).
作者姓名:曾锡山  胡俊荣
作者单位:1. 华南师范大学计算机学院,广州,510631
2. 华南师范大学图书馆,广州,510631
摘    要:对海量数据采集与挖掘技术的问题,提出如何利用WEB文本进行多断点控制、并发采集、网上清洗等新技术方法进行海量数据采集及处理,构建了基于WEB文本海量数据挖掘的应用统计系统,实现了三千多万条原始数据的采集、转换、统计.

关 键 词:WEB挖掘  文本挖掘  海量数据  数据转换  网上清洗

Research of Multi-Point Data Collecting and Processing in the Massive Web-text Mining Application
Zeng Xishan,Hu Junrong.Research of Multi-Point Data Collecting and Processing in the Massive Web-text Mining Application[J].Journal of Information,2010,29(8).
Authors:Zeng Xishan  Hu Junrong
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号