基于Hadoop的排序算法并行化改进 |
| |
引用本文: | 符彩珍,周国军,莫丽清,岑月明,梁徐萍.基于Hadoop的排序算法并行化改进[J].教育技术导刊,2016,15(4):68-70. |
| |
作者姓名: | 符彩珍 周国军 莫丽清 岑月明 梁徐萍 |
| |
作者单位: | 玉林师范学院 数学与信息科学学院,广西 玉林 537000 |
| |
摘 要: | 受单机内存和计算能力的限制,串行的排序算法难以对大数据进行高效排序。针对此问题,根据Hadoop的MapReduce框架对常用的内部排序算法进行并行化改进,给出改进算法的基本步骤,描述了Map、Partition和Reduce函数的主要代码。以折半插入排序和堆排序为例,通过实验比较串行算法和改进算法的执行时间,测试改进算法的可扩展性。实验结果表明,改进的并行排序算法具有较高的执行效率和较好的可扩展性。
|
关 键 词: | Hadoop平台 MapReduce模型 排序算法 大数据 |
|
| 点击此处可从《教育技术导刊》浏览原始摘要信息 |
| 点击此处可从《教育技术导刊》下载免费的PDF全文 |
|