线性时间排序之――基数排序

2014-11-23 23:40:06 · 作者: · 浏览: 3
我们知道,传统的比较排序法的时间复杂度是有下界的,最快也不会快于O(nlgn),比较排序顾名思义就是通过元素间的相互比较大小,完成排序,例如快速排序、堆排序、插入排序等等。而非比较排序法则可以做到在线性时间内排序。
为了介绍基数排序,我们先来介绍一种特例——计数排序。
计数排序为了实现线性时间排序,是需要条件的:我们需要知道待排序数据的范围。
计数排序对输入的数据有附加的限制条件:
1、输入的线性表的元素属于有限偏序集S;
2、设输入的线性表的长度为n,|S|=k(表示集合S中元素的总数目为k),则k=O(n)。
在这两个条件下,计数排序的复杂性为O(n)。
计数排序的基本思想是对于给定的输入序列中的每一个元素x,确定该序列中值小于x的元素的个数。一旦有了这个信息,就可以将x直接存放到最终的输出序列的正确位置上。例如,如果输入序列中只有17个元素的值小于x的值,则x可以直接存放在输出序列的第18个位置上。当然,如果有多个元素具有相同的值时,我们不能将这些元素放在输出序列的同一个位置上,因此,上述方案还要作适当的修改。
假设输入的线性表L的长度为n,L=L1,L2,..,Ln;线性表的元素属于有限偏序集S,|S|=k且k=O(n),S={S1,S2,..Sk};则计数排序可以描述如下:
1、扫描整个集合S,对每一个Si∈S,找到在线性表L中小于等于Si的元素的个数T(Si);
2、扫描整个线性表L,对L中的每一个元素Li,将Li放在输出线性表的第T(Li)个位置上,并将T(Li)减1。
#include   
using namespace std;  
  
void counting_sort(int *A, int *B, int size, int range)  
{  
    int *C = new int[range + 1];  
    for(int i = 0; i < range + 1; i++)  
        C[i] = 0;  
    for(int i = 0; i < size; i++)  
        C[A[i]]++;  
    for(int i = 1; i < range + 1; i++)  
        C[i] = C[i-1] + C[i];  
  
    for(int i = size - 1; i >= 0; i--)  
    {  
        B[C[A[i]] - 1] = A[i];  
        C[A[i]]--;  
    }  
}  
  
int main()  
{  
    int A[8] = {2, 5, 3, 0, 2, 3, 0, 3};  
    int B[8] = {0};  
    counting_sort(A, B, 8, 5);  
    for(int i = 0; i < 8; i++)  
        cout<

基数排序也是有条件的,那就是待排序的必须是数字。我们先按最低位,也就是个位数将数组排序,然后再按十位数排序,依次直到最高位。这里的每次排序都使用计数排序,因为计数排序是稳定的,基数排序就是依赖计数排序的稳定性来进行排序的。
但是,利用计数排序作为中间稳定排序的基数排序不是原地排序,很多比较排序的算法可以做到原地排序,因此,当内存宝贵时,快速排序更为可取。
例如
待排序数组[62,14,59,88,16]简单点五个数字
分配10个桶,桶编号为0-9,以个位数数字为桶编号依次入桶,变成下边这样
| 0 | 0 | 62 | 0 | 14 | 0 | 16 | 0 | 88 | 59 |
| 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |桶编号
将桶里的数字顺序取出来,
输出结果:[62,14,16,88,59]
再次入桶,不过这次以十位数的数字为准,进入相应的桶,变成下边这样:
由于前边做了个位数的排序,所以当十位数相等时,个位数字是由小到大的顺序入桶的,就是说,入完桶还是有序
| 0 | 14,16 | 0 | 0 | 0 | 59 | 62 | 0 | 88 | 0 |
| 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |桶编号
因为没有大过100的数字,没有百位数,所以到这排序完毕,顺序取出即可
最后输出结果:[14,16,59,62,88]