首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于Hadoop的排序算法并行化改进
引用本文:符彩珍,周国军,莫丽清,岑月明,梁徐萍.基于Hadoop的排序算法并行化改进[J].教育技术导刊,2016,15(4):68-70.
作者姓名:符彩珍  周国军  莫丽清  岑月明  梁徐萍
作者单位:玉林师范学院 数学与信息科学学院,广西 玉林 537000
摘    要:受单机内存和计算能力的限制,串行的排序算法难以对大数据进行高效排序。针对此问题,根据Hadoop的MapReduce框架对常用的内部排序算法进行并行化改进,给出改进算法的基本步骤,描述了Map、Partition和Reduce函数的主要代码。以折半插入排序和堆排序为例,通过实验比较串行算法和改进算法的执行时间,测试改进算法的可扩展性。实验结果表明,改进的并行排序算法具有较高的执行效率和较好的可扩展性。

关 键 词:Hadoop平台  MapReduce模型  排序算法  大数据  
点击此处可从《教育技术导刊》浏览原始摘要信息
点击此处可从《教育技术导刊》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号