約定
待排序的元素需要實現 Java 的 Comparable 接口,該接口有 compareTo() 方法,可以用它來判斷兩個元素的大小關系。
使用輔助函數 less() 和 swap() 來進行比較和交換的操作,使得代碼的可讀性和可移植性更好。
排序算法的成本模型是比較和交換的次數。
public abstract class Sort<T extends Comparable<T>> {
public abstract void sort(T[] nums);
protected boolean less(T v, T w) {
return v.compareTo(w) < 0;
}
protected void swap(T[] a, int i, int j) {
T t = a[i];
a[i] = a[j];
a[j] = t;
}
}
選擇排序
從數組中選擇最小元素,將它與數組的第一個元素交換位置。再從數組剩下的元素中選擇出最小的元素,將它與數組的第二個元素交換位置。不斷進行這樣的操作,直到將整個數組排序。
選擇排序需要 ~N2/2 次比較和 ~N 次交換,它的運行時間與輸入無關,這個特點使得它對一個已經排序的數組也需要這么多的比較和交換操作。
<div align="center"> <img src="http://img.vim-cn.com/d7/3a1a122af1b6b531eb90bd1042efc496404fa7.gif" width="230px"> </div>
public class Selection<T extends Comparable<T>> extends Sort<T> {
@Override
public void sort(T[] nums) {
int N = nums.length;
for (int i = 0; i < N - 1; i++) {
int min = i;
for (int j = i + 1; j < N; j++) {
if (less(nums[j], nums[min])) {
min = j;
}
}
swap(nums, i, min);
}
}
}
冒泡排序
從左到右不斷交換相鄰逆序的元素,在一輪的循環之后,可以讓未排序的最大元素上浮到右側。
在一輪循環中,如果沒有發生交換,那么說明數組已經是有序的,此時可以直接退出。
<div align="center"> <img src="http://img.vim-cn.com/56/622ca04e2566ddfd19a6887d800118feaae070.gif" width="200px"> </div>
public class Bubble<T extends Comparable<T>> extends Sort<T> {
@Override
public void sort(T[] nums) {
int N = nums.length;
boolean isSorted = false;
for (int i = N - 1; i > 0 && !isSorted; i--) {
isSorted = true;
for (int j = 0; j < i; j++) {
if (less(nums[j + 1], nums[j])) {
isSorted = false;
swap(nums, j, j + 1);
}
}
}
}
}
插入排序
每次都將當前元素插入到左側已經排序的數組中,使得插入之后左側數組依然有序。
對于數組 {3, 5, 2, 4, 1},它具有以下逆序:(3, 2), (3, 1), (5, 2), (5, 4), (5, 1), (2, 1), (4, 1),插入排序每次只能交換相鄰元素,令逆序數量減少 1,因此插入排序需要交換的次數為逆序數量。
插入排序的時間復雜度取決于數組的初始順序,如果數組已經部分有序了,那么逆序較少,需要的交換次數也就較少,時間復雜度較低。
- 平均情況下插入排序需要 ~N2/4 比較以及 ~N2/4 次交換;
- 最壞的情況下需要 ~N2/2 比較以及 ~N2/2 次交換,最壞的情況是數組是倒序的;
- 最好的情況下需要 N-1 次比較和 0 次交換,最好的情況就是數組已經有序了。
<div align="center"> <img src="http://img.vim-cn.com/47/534e6db3e5453c6072b40a2850548edc3cb334.gif" width="200px"> </div>
public class Insertion<T extends Comparable<T>> extends Sort<T> {
@Override
public void sort(T[] nums) {
int N = nums.length;
for (int i = 1; i < N; i++) {
for (int j = i; j > 0 && less(nums[j], nums[j - 1]); j--) {
swap(nums, j, j - 1);
}
}
}
}
希爾排序
對于大規模的數組,插入排序很慢,因為它只能交換相鄰的元素,每次只能將逆序數量減少 1。希爾排序的出現就是為了解決插入排序的這種局限性,它通過交換不相鄰的元素,每次可以將逆序數量減少大于 1。
希爾排序使用插入排序對間隔 h 的序列進行排序。通過不斷減小 h,最后令 h=1,就可以使得整個數組是有序的。
<div align="center"> <img src="http://img.vim-cn.com/22/328d862278aecf622bbfee162a5e6b0d8c264e.png" width="450px"> </div>
public class Shell<T extends Comparable<T>> extends Sort<T> {
@Override
public void sort(T[] nums) {
int N = nums.length;
int h = 1;
while (h < N / 3) {
h = 3 * h + 1; // 1, 4, 13, 40, ...
}
while (h >= 1) {
for (int i = h; i < N; i++) {
for (int j = i; j >= h && less(nums[j], nums[j - h]); j -= h) {
swap(nums, j, j - h);
}
}
h = h / 3;
}
}
}
希爾排序的運行時間達不到平方級別,使用遞增序列 1, 4, 13, 40, ... 的希爾排序所需要的比較次數不會超過 N 的若干倍乘于遞增序列的長度。后面介紹的高級排序算法只會比希爾排序快兩倍左右。
歸并排序
歸并排序的思想是將數組分成兩部分,分別進行排序,然后歸并起來。
<div align="center"> <img src="http://img.vim-cn.com/05/9c870ec626aaea89ff043b1c53b47cd7b939ba.png" width="300px"> </div>
1. 歸并方法
歸并方法將數組中兩個已經排序的部分歸并成一個。
public abstract class MergeSort<T extends Comparable<T>> extends Sort<T> {
protected T[] aux;
protected void merge(T[] nums, int l, int m, int h) {
int i = l, j = m + 1;
for (int k = l; k <= h; k++) {
aux[k] = nums[k]; // 將數據復制到輔助數組
}
for (int k = l; k <= h; k++) {
if (i > m) {
nums[k] = aux[j++];
} else if (j > h) {
nums[k] = aux[i++];
} else if (aux[i].compareTo(aux[j]) <= 0) {
nums[k] = aux[i++]; // 先進行這一步,保證穩定性
} else {
nums[k] = aux[j++];
}
}
}
}
2. 自頂向下歸并排序
將一個大數組分成兩個小數組去求解。
因為每次都將問題對半分成兩個子問題,這種對半分的算法復雜度一般為 O(NlogN)。
public class Up2DownMergeSort<T extends Comparable<T>> extends MergeSort<T> {
@Override
public void sort(T[] nums) {
aux = (T[]) new Comparable[nums.length];
sort(nums, 0, nums.length - 1);
}
private void sort(T[] nums, int l, int h) {
if (h <= l) {
return;
}
int mid = l + (h - l) / 2;
sort(nums, l, mid);
sort(nums, mid + 1, h);
merge(nums, l, mid, h);
}
}
3. 自底向上歸并排序
先歸并那些微型數組,然后成對歸并得到的微型數組。
public class Down2UpMergeSort<T extends Comparable<T>> extends MergeSort<T> {
@Override
public void sort(T[] nums) {
int N = nums.length;
aux = (T[]) new Comparable[N];
for (int sz = 1; sz < N; sz += sz) {
for (int lo = 0; lo < N - sz; lo += sz + sz) {
merge(nums, lo, lo + sz - 1, Math.min(lo + sz + sz - 1, N - 1));
}
}
}
}
快速排序
1. 基本算法
- 歸并排序將數組分為兩個子數組分別排序,并將有序的子數組歸并使得整個數組排序;
- 快速排序通過一個切分元素將數組分為兩個子數組,左子數組小于等于切分元素,右子數組大于等于切分元素,將這兩個子數組排序也就將整個數組排序了。
<div align="center"> <img src="http://img.vim-cn.com/7a/a080b952fa0bdb1e8c080adedf83b8d29c0742.png" width="280px"> </div>
public class QuickSort<T extends Comparable<T>> extends Sort<T> {
@Override
public void sort(T[] nums) {
shuffle(nums);
sort(nums, 0, nums.length - 1);
}
private void sort(T[] nums, int l, int h) {
if (h <= l)
return;
int j = partition(nums, l, h);
sort(nums, l, j - 1);
sort(nums, j + 1, h);
}
private void shuffle(T[] nums) {
List<Comparable> list = Arrays.asList(nums);
Collections.shuffle(list);
list.toArray(nums);
}
}
2. 切分
取 a[l] 作為切分元素,然后從數組的左端向右掃描直到找到第一個大于等于它的元素,再從數組的右端向左掃描找到第一個小于它的元素,交換這兩個元素。不斷進行這個過程,就可以保證左指針 i 的左側元素都不大于切分元素,右指針 j 的右側元素都不小于切分元素。當兩個指針相遇時,將切分元素 a[l] 和 a[j] 交換位置。
<div align="center"> <img src="http://img.vim-cn.com/fa/13649ddb1f30ecc08dfeec78087675bfe15b13.gif" width="320px"> </div>
private int partition(T[] nums, int l, int h) {
int i = l, j = h + 1;
T v = nums[l];
while (true) {
while (less(nums[++i], v) && i != h) ;
while (less(v, nums[--j]) && j != l) ;
if (i >= j)
break;
swap(nums, i, j);
}
swap(nums, l, j);
return j;
}
3. 性能分析
快速排序是原地排序,不需要輔助數組,但是遞歸調用需要輔助棧。
快速排序最好的情況下是每次都正好將數組對半分,這樣遞歸調用次數才是最少的。這種情況下比較次數為 CN=2CN/2+N,復雜度為 O(NlogN)。
最壞的情況下,第一次從最小的元素切分,第二次從第二小的元素切分,如此這般。因此最壞的情況下需要比較 N2/2。為了防止數組最開始就是有序的,在進行快速排序時需要隨機打亂數組。
4. 算法改進
4.1 切換到插入排序
因為快速排序在小數組中也會遞歸調用自己,對于小數組,插入排序比快速排序的性能更好,因此在小數組中可以切換到插入排序。
4.2 三數取中
最好的情況下是每次都能取數組的中位數作為切分元素,但是計算中位數的代價很高。一種折中方法是取 3 個元素,并將大小居中的元素作為切分元素。
4.3 三向切分
對于有大量重復元素的數組,可以將數組切分為三部分,分別對應小于、等于和大于切分元素。
三向切分快速排序對于有大量重復元素的隨機數組可以在線性時間內完成排序。
public class ThreeWayQuickSort<T extends Comparable<T>> extends QuickSort<T> {
@Override
protected void sort(T[] nums, int l, int h) {
if (h <= l) {
return;
}
int lt = l, i = l + 1, gt = h;
T v = nums[l];
while (i <= gt) {
int cmp = nums[i].compareTo(v);
if (cmp < 0) {
swap(nums, lt++, i++);
} else if (cmp > 0) {
swap(nums, i, gt--);
} else {
i++;
}
}
sort(nums, l, lt - 1);
sort(nums, gt + 1, h);
}
}
5. 基于切分的快速選擇算法
快速排序的 partition() 方法,會返回一個整數 j 使得 a[l..j-1] 小于等于 a[j],且 a[j+1..h] 大于等于 a[j],此時 a[j] 就是數組的第 j 大元素。
可以利用這個特性找出數組的第 k 個元素。
該算法是線性級別的,假設每次能將數組二分,那么比較的總次數為 (N+N/2+N/4+..),直到找到第 k 個元素,這個和顯然小于 2N。
public T select(T[] nums, int k) {
int l = 0, h = nums.length - 1;
while (h > l) {
int j = partition(nums, l, h);
if (j == k) {
return nums[k];
} else if (j > k) {
h = j - 1;
} else {
l = j + 1;
}
}
return nums[k];
}
堆排序
1. 堆
堆中某個節點的值總是大于等于其子節點的值,并且堆是一顆完全二叉樹。
堆可以用數組來表示,這是因為堆是完全二叉樹,而完全二叉樹很容易就存儲在數組中。位置 k 的節點的父節點位置為 k/2,而它的兩個子節點的位置分別為 2k 和 2k+1。這里不使用數組索引為 0 的位置,是為了更清晰地描述節點的位置關系。
<div align="center"> <img src="http://img.vim-cn.com/5d/953e5ff55d851b2be816e39db89532520554b4.png" width="170px"> </div>
public class Heap<T extends Comparable<T>> {
private T[] heap;
private int N = 0;
public Heap(int maxN) {
this.heap = (T[]) new Comparable[maxN + 1];
}
public boolean isEmpty() {
return N == 0;
}
public int size() {
return N;
}
private boolean less(int i, int j) {
return heap[i].compareTo(heap[j]) < 0;
}
private void swap(int i, int j) {
T t = heap[i];
heap[i] = heap[j];
heap[j] = t;
}
}
2. 上浮和下沉
在堆中,當一個節點比父節點大,那么需要交換這個兩個節點。交換后還可能比它新的父節點大,因此需要不斷地進行比較和交換操作,把這種操作稱為上浮。
<div align="center"> <img src="http://img.vim-cn.com/1c/d0fa07f3f03fd8c711283e45b128ba801faf3b.gif" width="270px"> </div>
private void swim(int k) {
while (k > 1 && less(k / 2, k)) {
swap(k / 2, k);
k = k / 2;
}
}
類似地,當一個節點比子節點來得小,也需要不斷地向下進行比較和交換操作,把這種操作稱為下沉。一個節點如果有兩個子節點,應當與兩個子節點中最大那個節點進行交換。
<div align="center"> <img src="http://img.vim-cn.com/21/7d2f02ef572ee35d76981de2fd8d5c5f878f50.gif" width="270px"> </div>
private void sink(int k) {
while (2 * k <= N) {
int j = 2 * k;
if (j < N && less(j, j + 1))
j++;
if (!less(k, j))
break;
swap(k, j);
k = j;
}
}
3. 插入元素
將新元素放到數組末尾,然后上浮到合適的位置。
public void insert(Comparable v) {
heap[++N] = v;
swim(N);
}
4. 刪除最大元素
從數組頂端刪除最大的元素,并將數組的最后一個元素放到頂端,并讓這個元素下沉到合適的位置。
public T delMax() {
T max = heap[1];
swap(1, N--);
heap[N + 1] = null;
sink(1);
return max;
}
5. 堆排序
把最大元素和當前堆中數組的最后一個元素交換位置,并且不刪除它,那么就可以得到一個從尾到頭的遞減序列,從正向來看就是一個遞增序列,這就是堆排序。
5.1 構建堆
無序數組建立堆最直接的方法是從左到右遍歷數組進行上浮操作。一個更高效的方法是從右至左進行下沉操作,如果一個節點的兩個節點都已經是堆有序,那么進行下沉操作可以使得這個節點為根節點的堆有序。葉子節點不需要進行下沉操作,可以忽略葉子節點的元素,因此只需要遍歷一半的元素即可。
<div align="center"> <img src="http://img.vim-cn.com/2f/cc7f54b8f5a060145201751fb384230a7a639c.gif" width="210px"> </div>
5.2 交換堆頂元素與最后一個元素
交換之后需要進行下沉操作維持堆的有序狀態。
<div align="center"> <img src="http://img.vim-cn.com/7b/3436461f381309761f02b47ec1a04a860674be.gif" width="250px"> </div>
public class HeapSort<T extends Comparable<T>> extends Sort<T> {
/**
* 數組第 0 個位置不能有元素
*/
@Override
public void sort(T[] nums) {
int N = nums.length - 1;
for (int k = N / 2; k >= 1; k--)
sink(nums, k, N);
while (N > 1) {
swap(nums, 1, N--);
sink(nums, 1, N);
}
}
private void sink(T[] nums, int k, int N) {
while (2 * k <= N) {
int j = 2 * k;
if (j < N && less(nums, j, j + 1))
j++;
if (!less(nums, k, j))
break;
swap(nums, k, j);
k = j;
}
}
private boolean less(T[] nums, int i, int j) {
return nums[i].compareTo(nums[j]) < 0;
}
}
6. 分析
一個堆的高度為 logN,因此在堆中插入元素和刪除最大元素的復雜度都為 logN。
對于堆排序,由于要對 N 個節點進行下沉操作,因此復雜度為 NlogN。
堆排序是一種原地排序,沒有利用額外的空間。
現代操作系統很少使用堆排序,因為它無法利用局部性原理進行緩存,也就是數組元素很少和相鄰的元素進行比較和交換。
小結
1. 排序算法的比較
算法 | 穩定性 | 時間復雜度 | 空間復雜度 | 備注 |
---|---|---|---|---|
選擇排序 | × | N2 | 1 | |
冒泡排序 | √ | N2 | 1 | |
插入排序 | √ | N ~ N2 | 1 | 時間復雜度和初始順序有關 |
希爾排序 | × | N 的若干倍乘于遞增序列的長度 | 1 | 改進版插入排序 |
快速排序 | × | NlogN | logN | |
三向切分快速排序 | × | N ~ NlogN | logN | 適用于有大量重復主鍵 |
歸并排序 | √ | NlogN | N | |
堆排序 | × | NlogN | 1 | 無法利用局部性原理 |
快速排序是最快的通用排序算法,它的內循環的指令很少,而且它還能利用緩存,因為它總是順序地訪問數據。它的運行時間近似為 ~cNlogN,這里的 c 比其它線性對數級別的排序算法都要小。
使用三向切分快速排序,實際應用中可能出現的某些分布的輸入能夠達到線性級別,而其它排序算法仍然需要線性對數時間。
2. Java 的排序算法實現
Java 主要排序方法為 java.util.Arrays.sort(),對于原始數據類型使用三向切分的快速排序,對于引用類型使用歸并排序。