排序是MapReduce框架中最重要的操作之一。
MapTask和ReduceTask在执行过过程中都会按照数据的key进行排序,排序是Hadoop的默认行为,不排序都不行,所以可以利用排序这个机制,来完成咱们想要的排序工作。
默认排序是按照字典顺序排序,且实现该排序的方法是快速排序。
首先本排序案例是在
editor.csdn.net/md/?article…
案例的基础上实现的,如果未实现,请先实现上面这个案例,能得到下面所示的已经有的结果的数据,对结果的数据进行排序。
项目结构
FlowBean.java
package com.zhenghui.writablecomparable;