首页 | 本学科首页   官方微博 | 高级检索  
     检索      

Google三大云计算技术对海量数据分析流程的技术改进优化研究
引用本文:卢小宾,王涛.Google三大云计算技术对海量数据分析流程的技术改进优化研究[J].图书情报工作,2015,59(3):6.
作者姓名:卢小宾  王涛
作者单位:中国人民大学信息资源管理学院 北京 100872
基金项目:本文系国家社会科学基金重大项目"云计算环境下的信息资源集成与服务研究"(项目编号:12&ZD220)和国家自然科学基金项目"语义Web环境下的大规模协同知识处理模型研究"(项目编号:71103020)研究成果之一。
摘    要:目的/意义] 建构云计算技术环境下的海量数据分析是一种需要预载大量数据集的数据计算处理。针对传统海量数据分析处理数据细节方式所导致的分析质量与效率问题,运用Google三大云计算技术对其进行改进。方法/过程] 通过对Google三大云计算技术——GFS、MapReduce和Bigtable进行文献调查、内容分析和技术分析,梳理出Google云计算技术在数据处理、技术架构和算法模型等方面的部署创新和设计改进。结果/结论] 将Google云计算技术与传统本地数据分析处理方式与细节进行比较分析,得出Google云计算技术在操作海量数据分析时所具备的处理优势。借助Google云计算三大技术,提出海量数据分析流程在存储和访问、组织与管理以及并行处理3个方面的技术优化与改进策略。

关 键 词:云计算  信息分析  Google云计算技术  GFS  MapReduce  Bigtable  
收稿时间:2014-09-02

Technology Improvement and Optimization of Massive Data Analysis Process by the Three Google Cloud Computing Techniques
Lu Xiaobin,Wang Tao.Technology Improvement and Optimization of Massive Data Analysis Process by the Three Google Cloud Computing Techniques[J].Library and Information Service,2015,59(3):6.
Authors:Lu Xiaobin  Wang Tao
Institution:School of Information Resource Management, Renmin University of China, Beijing 100872
Abstract:Purpose/significance] Massive data analysis constructed in the cloud computing environment is a data calculation which needs to preload large data sets. Aiming at the analysis quality and efficiency issues caused by the detail way of massive data analysis and processing by the traditional methods, this paper uses the three Google cloud computing techniques to improve it.Method/process] Applying literature research, content analysis and technical analysis to the three Google cloud computing technology: GFS, MapReduce and Bigtable, this paper summarizes the deployment innovation and design improvement of Google cloud computing technology in data processing, technology framework and algorithm model.Result/conclusion] Comparing Google cloud computing technology comparative analysis with traditional local data processing mode, this paper concludes the processing advantages of Google cloud computing technology in operating massive data analysis. According to the Google cloud computing, we propose technology optimization and improvement of massive data analysis process in the three aspects-store and access, organization and management, as well as parallel processing.
Keywords:cloud computing  information analysis  Google cloud computing technology  GFS  MapReduce  Bigtable  
点击此处可从《图书情报工作》浏览原始摘要信息
点击此处可从《图书情报工作》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号