本文已参与[新人创作礼]活动,一起开启掘金创作之路
计数排序: 计数排序是一个非基于比较的排序算法!(颠覆了你对寻常排序的概念)
它的优势在于在对一定范围内的整数排序时,它的复杂度为Ο(n+k)(其中k是整数的范围),快于任何比较排序算法。
它的缺点在于这是一种牺牲空间换取时间的做法,而且当O(k)>O(n*log(n))的时候其效率反而不如基于比较的排序。
划重点: 在范围比较小的时候,它的速度甚至快于快速排序!
计数排序的思想: 对于给定的输入序列中的每一个元素x,确定该序列中值小于x的元素的个数(此处并非比较各元素的大小,而是通过对元素值的计数和计数值的累加来确定)。一旦有了这个信息,就可以将x直接存放到最终的输出序列的正确位置上。例如,如果输入序列中只有17个元素的值小于x的值,则x可以直接存放在输出序列的第18个位置上。 ↑ 这是来自百度的说法,可能有点绕,下面会有另外一种对计数排序的描述。
#include <iostream>
using namespace std;
const int MAXN = 10000; //最大长度 所能判断的最长数组
const int k = 100; // range(范围) 数组内的最大值(不包含)
int a[MAXN], c[MAXN], ranked[MAXN];
int main() {
int n;
cin >> n; //输入数组长度
for (int i = 0; i < n; ++i) {
cin >> a[i];
++c[a[i]]; //c数组对应a[i]元素+1 等价于 c[a[i]]记录了a[i]这个元素的数量
}
for (int i = 1; i < k; ++i)
c[i] += c[i-1];//此时c[i]代表的是 i这个数字之前的数+i本身这个数 在所排序数组里面的数量 c[i]-c[i-1]代表的就是i这个元素在所排序数组里面的数量
for (int i = n-1; i >= 0; --i)
{
//如果是i表达的是原数标号,a[i]就是排序后的正确序列
//这里之所以要先减1是为了让ranked可以从index=0开始(上文已说明,此时的c记录的是数量(数量为0是没有意义的)
ranked[--c[a[i]]] = a[i];
}
for (int i = 0; i < n; ++i)
cout << ranked[i] <<" ";
cout<<endl;
return 0;
}
上述代码只是一个对计数排序的实现,并非最优,但是这个方法是一个稳定排序。
另一种计数排序描述的图文详解如下
我们假设要排序的数组如下
a = {9, 3, 5, 4, 9, 1, 2, 7, 8,1,3, 6, 5, 3, 4, 0, 10, 9, 7, 9}
这个数组中最大的值为10,因此我们建立一个长度为11的数组b (取数组中最大的数值+1,这样可以包括0-10),从0-10如下图
遍历这个无序的数组a,每一个整数按照其值对号入座,对应数组下标的元素进行加1操作。
比如第一个整数是9,那么数组下标为9的元素加1:
以此类推遍历整个数组a,我们会得到下面这样一个记录a数组中各个元素数量的数组b,比如索引为5的上面数字为2表明这个数组中有2个5。
接下来只要遍历上图数组b,输出索引对应值数量的索引就可以得到排序后的数组,如下:
sorted = {0, 1, 1, 2, 3, 3, 3, 4, 4, 5, 5, 6, 7, 7, 8, 9, 9, 9, 9, 10}
问题1: 如果一个未排序的数组 a = {45,47,48,46,50},这个时候难道要创建一个0-50的数组吗? 问题2: 如果一个未排序的数组 a = {4,1,100},这个时候难道要创建一个0-100的数组吗? 问题3: 上述思想 (另一种计数排序描述的图文详解) 得到的数组是稳定的吗?
针对问题1: 如果创建0-50的数组,那0-44的空间都是浪费的,此时的方法就是, 不在使用 最大值+1 的方式创建数组,改用 最大值-最小值+1 的方式创建数组,此时数组最小值同时作为创建出来数组的偏移量。 以问题1的数组为例,那此时创建一个b[6] 的数组(50-45+1),此时b[0]~b[5]分别代表 45、46、47、48、49、50
void CountSort(int a[],int len)
{
int max=a[0],min=a[0];
//求得数组中的最大值和最小值
for (int i=1;i<len;i++)
{
if(a[i]>max)
max = a[i];
if(a[i]<min)
min = a[i];
}
//算出所创建数组的长度
cout<<max<<" "<<min<<" "<<len<<endl;
int n = max-min+1;
cout<<n<<endl;
int countArray[n] = {};
int ranked[len] = {};
//同之前的算法
for (int i=0;i<len;i++)
{
++countArray[a[i]-min];//记得要减去偏移量
}
for (int i = 1; i < n; ++i)
countArray[i] += countArray[i-1];
for (int i = len-1; i >= 0; --i)
{
ranked[--countArray[a[i]-min]] = a[i];//记得要减去偏移量
}
for (int i=0;i<len;i++)
a[i]=ranked[i];
}
int main()
{
int a[] = {45,47,48,46,50};
CountSort(a,sizeof(a)/sizeof(*a));
for(int i=0;i<sizeof(a)/sizeof(*a);i++)
cout<<a[i]<<" ";
cout<<endl;
}
针对问题2: 答案是,是的。 想法:此时的max-min+1明显是大于原数组的长度 3 的,那是不是可以直接创建一个长度为3数组,因为此时的数组里只有3个数字,那不是哪怕3个数字都不一样也就最多3个数字吗? ←这种想法就已经违背了计数排序的思想了。
针对问题2: 这种思想到最后仅仅是得到了一个有序数组,但是已经与原数组的排序没有关系了。
总结: 1、当数组较小且分布较为密集的时候,计数算法是一种不错的算法 2、当数列最大最小值差距过大时,并不适用于计数排序 3、对于非数字其实也可以用计数算法,比如26个字母,可以先做一层映射,a=0,b=1…………再比如多类运动项目喜欢人数的排序,还有许多诸如此类的类比
参考博客https://www.cnblogs.com/kyoner/p/10604781.html 参考博客https://www.cnblogs.com/xiaochuan94/p/11198610.html 百度百科
又拖更了,这玩意写起来比想象中的要复杂,而且引申出很多问题,那就拖一更吧!