一、直接插入排序
原理
直接插入排序是一種最基本的插入排序方法,能夠將第i個記錄插入到前面i-1個已排好序的記錄中,具體插入過程如下所示。
將第i個記錄的關鍵字Ki 順序與其前面記錄的關鍵字Ki-1 , Ki-2 , …, K1 進行比較,將所有關鍵字大于Ki 的記錄依次向后移動一個位置,直到遇見關鍵字小于或者等于Ki 的記錄Kj 。此時Kj 后面必為空位置,將第i個記錄插入空位置即可。完整的直接插入排序是從i=2開始的,也就是說,將第一個記錄作為已排好序的單元素子集合,然后將第二個記錄插入到單元素子集合中。將i從2循環到n,即可實現完整的直接插入排序。
下圖給出了一個完整的直接插入排序實例。圖中大括號內為當前已排好序的記錄子集合:
假設待排序記錄保存在r[1..n]中,我們需要設置一個監視哨r[0],使得r[0]始終保存待插入的記錄,這樣的目的是能夠提高效率。此處設置監視哨的目的有如下兩個作用:
- 備份待插入的記錄,以便前面關鍵字較大的記錄后移。
- 防止越界,這一點與順序查找法中監視哨的作用相同。
動畫演示過程
Go語言描述
插入排序思想的核心就是局部有序,對于樣本小且基本有序的時候效率不錯,實戰可用。
- 平均時間復雜度:O(n2)
- 最壞時間復雜度:O(n2)
- 最好時間復雜度:O(n)
- 空間復雜度:O(1)
- 穩定性:穩定
直接插入排序實現:
每一步將一個待排序的記錄,插入到前面已經排好序的有序序列中去,直到插完所有元素為止。
func InsertionSort(list []int) {
// 獲取數組長度
l := len(list)
// 2.外層循環從1開始,依次遍歷到最后
for i := 1; i < l; i++ {
// 3.記錄當前輪次選出的元素的位置
tmp := list[i]
j := i
// 4.內層循環不確定循環次數,依次比較前面的局部有序元素
for j > 0 && list[j-1] > tmp {
fmt.Print(j, " ") // 標記移動元素的次數
list[j] = list[j-1]
j--
list[j] = tmp
}
// fmt.Println()
}
}
直接插入排序在最好情況下,需要比較n-1次,無需交換元素,時間復雜度為O(n);在最壞情況下,時間復雜度依然為O(n2)。但是在數組元素隨機排列的情況下,插入排序還是要優于冒泡排序和直接選擇排序這兩種排序的。
直接插入排序算法并不是任意使用的,它比較適用于待排序記錄數目較少且基本有序的情形。當待排記錄數目較大時,直接使用插入排序會降低很多性能。針對上述情形,如果硬要使用插入排序算法,則可以對直接插入排序進行改進。具體改進方法是在直接插入排序法的基礎上,減少“比較關鍵字”和“移動記錄”這兩種操作的次數。
二、希爾排序
原理
希爾排序又被稱為縮小增量排序法,這是一種基于插入思想的排序方法。希爾排序利用了直接插入排序的最佳性質,首先將待排序的關鍵字序列分成若干個較小的子序列,然后對子序列進行直接插入排序操作。經過上述粗略調整,整個序列中的記錄已經基本有序,最后再對全部記錄進行一次直接插入排序。在時間耗費上,希爾排序與直接插入排序法相比,其性能有了很大改進。
在進行直接插入排序時,如果待排序記錄序列已經有序時,直接插入排序的時間復雜度可以提高到O(n)。因為希爾排序對直接插入排序進行了改進,所以大大提高了排序的效率。
下圖為希爾排序的過程:
希爾排序在具體實現時,首先選定兩個記錄間的距離d1 ,在整個待排序記錄序列中將所有間隔為d1 的記錄分成一組,然后在組內進行直接插入排序。接下來取兩個記錄間的距離d2 <d1 ,在整個待排序記錄序列中,將所有間隔為d2 的記錄分成一組,進行組內直接插入排序,一直到選定兩個記錄間的距離dt =1為止。此時只有一個子序列,即整個待排序記錄序列。
動畫演示過程
Go語言描述
希爾排序是第一個突破O(n2)效率的算法,它是插入排序的增強版,可以理解為分組插入排序。
希爾排序是把記錄按下標的一定增量分組,對每組使用直接插入排序算法排序;隨著增量逐漸減少,每組包含的關鍵詞越來越多,當增量減至1時,
整個文件恰被分成一組,算法便終止。平均的時間復雜度O(nlogn)。但是它相對比較簡單,它適合于數據量在5000以下并且速度并不是特別重要的場合。
它對于數據量較小的數列重復排序是非常好的。最壞的情況下時間復雜度是 O(n^2)。
- 平均時間復雜度:O(n^1.3)
- 最壞時間復雜度:O(n2)
- 最好時間復雜度:O(n)
- 空間復雜度:O(1)
- 穩定性:不穩定
關鍵思路:
一、選擇合適的增量分組:
1.在希爾排序的原稿中,建議初始間距是N/2,簡單把每趟排序分成兩半
2.該方法好處是不需要在開始排序前為找合適的增量而進行任何計算
二、Hibbard增量序列
1.增量算法為2k - 1 ,也就是1 3 5 7...
2.該方法最壞的復雜度為O(N3/2),猜想的平均復雜度為O(N5/4),目前尚未被證明
三、Sedgewick增量序列
1.{1,5,19,41,109,...},該序列中的項或者是94^i - 9*2^i +1 或4^i -32^i +1
2.這種增量的最壞復雜度為O(N^4/3),平均復雜度為 O(N^7/6),但均未被證明
func ShellSort(list []int) {
// 1.獲取數組的長度
l := len(list)
// 2.定義初始化的增量gap
gap := l / 2
// 3.不斷縮小gap增量
for gap >= 1 {
// 4.以gap作為間隔進行分組,對分組進行插入排序
for i := gap; i < l; i++ {
tmp := list[i]
j := i
for j > gap-1 && list[j-gap] > tmp {
list[j] = list[j-gap]
j -= gap
}
list[j] = tmp
}
// 5.折半縮小gap分組增量
gap = gap / 2
}
}