目錄
- 1.比較型排序算法對(duì)比
- 2.比較排序算法的下界
2.1 算法導(dǎo)論提供的解釋
2.2 劉未鵬提供的解釋 - 3.快排為什么那么快?
3.1 為什么堆排比快排慢
3.2 為什么快排其實(shí)也不是那么快
3.3 計(jì)數(shù)排序、桶排序?yàn)槭裁茨敲纯欤?/li> - 4.一種看問題的視角
- 5.排序算法的應(yīng)用
1.比較型排序算法對(duì)比
2.比較排序算法的下界
2.1 算法導(dǎo)論提供的解釋
在一個(gè)比較排序算法中,只使用元素間的比較來獲得輸入序列<a1, a2, ... , an>中元素間次序的信息。
比較排序可以抽象成一顆決策樹,決策樹是一顆完全二叉樹,它可以表示在給定輸入規(guī)模的情況下,某一特定排序算法對(duì)所有元素的比較操作。
在決策樹中,每個(gè)內(nèi)部節(jié)點(diǎn)都以i:j標(biāo)記,其中, 1≤i, j ≤n,n是輸入序列中的元素個(gè)數(shù)。每個(gè)葉節(jié)點(diǎn)都標(biāo)注了一個(gè)序列<Π(1), Π(2), ..., Π(n),>。排序算法的執(zhí)行對(duì)應(yīng)于一條從樹的根節(jié)點(diǎn)到葉節(jié)點(diǎn)的路徑。每一個(gè)內(nèi)部節(jié)點(diǎn)表示一次比較ai≤aj。左子樹表示一旦我們確定ai≤aj之后的后續(xù)比較,右子樹表示在確定了ai>aj后的后續(xù)比較。當(dāng)?shù)竭_(dá)一個(gè)葉節(jié)點(diǎn)時(shí),表示排序算法已經(jīng)確定了一個(gè)順序:
最壞情況的下界:
在決策樹中,從根節(jié)點(diǎn)到任意一個(gè)可達(dá)葉節(jié)點(diǎn)之間最長(zhǎng)簡(jiǎn)單路徑的長(zhǎng)度,表示的是對(duì)應(yīng)的排序算法中最壞情況下的比較次數(shù)。也即決策樹的高度。
2.2 劉未鵬提供的解釋
排序的本質(zhì):一組未排序的n個(gè)數(shù)字,它們一共有n!種排序,其中只有一種排列是從小到大排列。
比較排序:任何基于比較的排序基本操作單元都是“比較a和b”,輸出只有兩種答案。一個(gè)只有兩種輸出的問題最多只能將可能性空間切成兩半,最佳的切法是切成1/2和1/2。
最優(yōu)下界:我們希望每次比較a和b時(shí),a<b和a>b的概率是均等的,這樣我們就能保證無論無任何都能講可能性縮小為原來的一半。
- log_2(n!) = nlogn
3.快排為什么那么快?
3.1 為什么堆排比快排慢
堆排的步驟:
- step1.建立最大堆(堆頂?shù)脑卮笥趦蓚€(gè)兒子,兩個(gè)兒子又分別大于它們各自下屬的兩個(gè)兒子...)
- step2.將堆頂?shù)脑睾妥詈笠粋€(gè)元素對(duì)調(diào)(相當(dāng)于將堆頂拿走,然后將堆底的那個(gè)元素補(bǔ)上空位,然后讓那最后一個(gè)元素從頂上往下滑到恰當(dāng)?shù)奈恢茫匦鲁蔀樽畲蠖眩?/li>
- step3.重復(fù)第二步
堆底的元素肯定很小,將它拿到堆頂和原本屬于最大元素的兩個(gè)子節(jié)點(diǎn)比較,它比它們大的可能性是微乎其微的。這一次的比較結(jié)果是概率不均等的。
實(shí)際上該元素肯定小于其中的一個(gè)兒子(從一顆子樹的最底下取出的),而大于另一個(gè)兒子的可能性非常小。
改進(jìn)版:MacKay提供了一個(gè)修改版的堆排,每次不是將堆底的元素拿上來,而是直接比較堆頂元素的兩個(gè)兒子,選出次大的元素。(這個(gè)怎么實(shí)現(xiàn)?如下圖所示)
3.2 為什么快排其實(shí)也不是那么快
快排的過程:
隨機(jī)選擇一個(gè)軸元素,將所有大于軸元素的移到左邊,其余移到右邊。
快排的第一次比較是將一個(gè)元素和軸元素比較,這個(gè)時(shí)候“大于”和“小于”各占一半。
快排的第二次比較a2與pivot比較,不妨令a1 < pivot,就有三種不同的情況
a2 < pivot: a1 < a2 < pivot; a2 < a1 < pivot 這個(gè)可能性占了2/3
a2 > pivot: a1 < pivot < a2這個(gè)可能性占了1/3
因此不是等概率的劃分可能性空間
3.3 計(jì)數(shù)排序、桶排序?yàn)槭裁茨敲纯欤?/h2>
當(dāng)i張牌放到位之后,放置第i+1張牌的時(shí)候有多少種可能性?大約i+1中。因?yàn)榍癷張牌將13個(gè)位置分割成了i+1個(gè)區(qū)間。因此計(jì)數(shù)排序砍掉了i/i+1種可能性。
4.一種看問題的視角
將排序問題看成和猜數(shù)字一樣,是通過問問題來縮小/排除結(jié)果的可能性區(qū)間。
“最好的問題”就是那些能夠均分所有可能性的問題,因?yàn)槟芘懦鬹-1/k種可能性,而不均衡的問題會(huì)有一個(gè)或者一些答案分支排除掉的可能性少于k-1/k,于是策略的下界就被拖累了。
5.排序算法的應(yīng)用
5.1 商業(yè)計(jì)算
5.2 信息搜索
有序的信息確保可以用經(jīng)典的二分查找法進(jìn)行高效的搜索。
查找、搜索——二分查找的各種擴(kuò)展——各種搜索樹。