本文匯總了技術面試時需要了解的算法和數據結構知識。
數據結構部分
鏈表
鏈表是一種由節點(Node)組成的線性數據集合,每個節點通過指針指向下一個節點。它是一種由節點組成,并能用于表示序列的數據結構。
單鏈表:每個節點僅指向下一個節點,最后一個節點指向空(null)。
雙鏈表:每個節點有兩個指針p,n。p指向前一個節點,n指向下一個節點;最后一個節點指向空。
循環鏈表:每個節點指向下一個節點,最后一個節點指向第一個節點。
時間復雜度:
索引:O(n)
查找:O(n)
插入:O(1)
刪除:O(1)
棧
棧是一個元素集合,支持兩個基本操作:push用于將元素壓入棧,pop用于刪除棧頂元素。
后進先出的數據結構(Last In First Out, LIFO)
時間復雜度
索引:O(n)
查找:O(n)
插入:O(1)
刪除:O(1)
隊列
隊列是一個元素集合,支持兩種基本操作:enqueue 用于添加一個元素到隊列,dequeue 用于刪除隊列中的一個元素。
先進先出的數據結構(First In First Out, FIFO)。
時間復雜度
索引:O(n)
查找:O(n)
插入:O(1)
刪除:O(1)
樹
樹是無向、聯通的無環圖。
二叉樹
二叉樹是一個樹形數據結構,每個節點最多可以有兩個子節點,稱為左子節點和右子節點。
滿二叉樹(Full Tree):二叉樹中的每個節點有 0 或者 2 個子節點。
完美二叉樹(Perfect Binary):二叉樹中的每個節點有兩個子節點,并且所有的葉子節點的深度是一樣的。
完全二叉樹:二叉樹中除最后一層外其他各層的節點數均達到最大值,最后一層的節點都連續集中在最左邊。
二叉查找樹
二叉查找樹(BST)是一種二叉樹。其任何節點的值都大于等于左子樹中的值,小于等于右子樹中的值。
時間復雜度
索引:O(log(n))
查找:O(log(n))
插入:O(log(n))
刪除:O(log(n))
字典樹
字典樹,又稱為基數樹或前綴樹,是一種用于存儲鍵值為字符串的動態集合或關聯數組的查找樹。樹中的節點并不直接存儲關聯鍵值,而是該節點在樹中的位置決定了其關聯鍵值。一個節點的所有子節點都有相同的前綴,根節點則是空字符串。
樹狀數組
樹狀數組,又稱為二進制索引樹(Binary Indexed Tree,BIT),其概念上是樹,但以數組實現。數組中的下標代表樹中的節點,每個節點的父節點或子節點的下標可以通過位運算獲得。數組中的每個元素都包含了預計算的區間值之和,在整個樹更新的過程中,這些計算的值也同樣會被更新。
時間復雜度
區間求和:O(log(n))
更新:O(log(n))
線段樹
線段樹是用于存儲區間和線段的樹形數據結構。它允許查找一個節點在若干條線段中出現的次數。
時間復雜度
區間查找:O(log(n))
更新:O(log(n))
堆
堆是一種基于樹的滿足某些特性的數據結構:整個堆中的所有父子節點的鍵值都滿足相同的排序條件。堆分為最大堆和最小堆。在最大堆中,父節點的鍵值永遠大于等于所有子節點的鍵值,根節點的鍵值是最大的。最小堆中,父節點的鍵值永遠小于等于所有子節點的鍵值,根節點的鍵值是最小的。
時間復雜度
索引:O(log(n))
查找:O(log(n))
插入:O(log(n))
刪除:O(log(n))
刪除最大值/最小值:O(1)
哈希
哈希用于將任意長度的數據映射到固定長度的數據。哈希函數的返回值被稱為哈希值、哈希碼或者哈希。如果不同的主鍵得到相同的哈希值,則發生了沖突。
Hash Map:hash map 是一個存儲鍵值間關系的數據結構。HashMap 通過哈希函數將鍵轉化為桶或者槽中的下標,從而便于指定值的查找。
沖突解決
鏈地址法(Separate Chaining):在鏈地址法中,每個桶(bucket)是相互獨立的,每一個索引對應一個元素列表。處理HashMap 的時間就是查找桶的時間(常量)與遍歷列表元素的時間之和。
開放地址法(Open Addressing):在開放地址方法中,當插入新值時,會判斷該值對應的哈希桶是否存在,如果存在則根據某種算法依次選擇下一個可能的位置,直到找到一個未被占用的地址。開放地址即某個元素的位置并不永遠由其哈希值決定。
圖
圖是G =(V,E)的有序對,其包括頂點或節點的集合 V 以及邊或弧的集合E,其中E包括了兩個來自V的元素(即邊與兩個頂點相關聯 ,并且該關聯為這兩個頂點的無序對)。
無向圖:圖的鄰接矩陣是對稱的,因此如果存在節點 u 到節點 v 的邊,那節點 v 到節點 u 的邊也一定存在。
有向圖:圖的鄰接矩陣不是對稱的。因此如果存在節點 u 到節點 v 的邊并不意味著一定存在節點 v 到節點 u 的邊。
算法部分
排序
快速排序
穩定:否
時間復雜度
最優:O(nlog(n))
最差:O(n^2)
平均:O(nlog(n))
合并排序
合并排序是一種分治算法。這個算法不斷地將一個數組分為兩部分,分別對左子數組和右子數組排序,然后將兩個數組合并為新的有序數組。
穩定:是
時間復雜度:
最優:O(nlog(n))
最差:O(nlog(n))
平均:O(nlog(n))
桶排序
桶排序是一種將元素分到一定數量的桶中的排序算法。每個桶內部采用其他算法排序,或遞歸調用桶排序。
時間復雜度
最優:Ω(n + k)
最差: O(n^2)
平均:Θ(n + k)
基數排序
基數排序類似于桶排序,將元素分發到一定數目的桶中。不同的是,基數排序在分割元素之后沒有讓每個桶單獨進行排序,而是直接做了合并操作。
時間復雜度
最優:Ω(nk)
最差: O(nk)
平均:Θ(nk)
圖算法
深度優先搜索
深度優先搜索是一種先遍歷子節點而不回溯的圖遍歷算法。
時間復雜度:O(|V| + |E|)
廣度優先搜索
廣度優先搜索是一種先遍歷鄰居節點而不是子節點的圖遍歷算法。
時間復雜度:O(|V| + |E|)
拓撲排序
拓撲排序是有向圖節點的線性排序。對于任何一條節點 u 到節點 v 的邊,u 的下標先于 v。
時間復雜度:O(|V| + |E|)
Dijkstra算法
Dijkstra 算法是一種在有向圖中查找單源最短路徑的算法。
時間復雜度:O(|V|^2)
Bellman-Ford算法
Bellman-Ford 是一種在帶權圖中查找單一源點到其他節點最短路徑的算法。
雖然時間復雜度大于 Dijkstra 算法,但它可以處理包含了負值邊的圖。
時間復雜度:
最優:O(|E|)
最差:O(|V||E|)
Floyd-Warshall 算法
Floyd-Warshall 算法是一種在無環帶權圖中尋找任意節點間最短路徑的算法。
該算法執行一次即可找到所有節點間的最短路徑(路徑權重和)。
時間復雜度:
最優:O(|V|^3)
最差:O(|V|^3)
平均:O(|V|^3)
最小生成樹算法
最小生成樹算法是一種在無向帶權圖中查找最小生成樹的貪心算法。換言之,最小生成樹算法能在一個圖中找到連接所有節點的邊的最小子集。
時間復雜度:O(|V|^2)
Kruskal 算法
Kruskal 算法也是一個計算最小生成樹的貪心算法,但在 Kruskal 算法中,圖不一定是連通的。
時間復雜度:O(|E|log|V|)
貪心算法
貪心算法總是做出在當前看來最優的選擇,并希望最后整體也是最優的。
使用貪心算法可以解決的問題必須具有如下兩種特性:
最優子結構
問題的最優解包含其子問題的最優解。
貪心選擇
每一步的貪心選擇可以得到問題的整體最優解。
實例-硬幣選擇問題
給定期望的硬幣總和為 V 分,以及 n 種硬幣,即類型是 i 的硬幣共有 coinValue[i] 分,i的范圍是 [0…n – 1]。假設每種類型的硬幣都有無限個,求解為使和為 V 分最少需要多少硬幣?
硬幣:便士(1美分),鎳(5美分),一角(10美分),四分之一(25美分)。
假設總和 V 為41,。我們可以使用貪心算法查找小于或者等于 V 的面值最大的硬幣,然后從 V 中減掉該硬幣的值,如此重復進行。
V = 41 | 使用了0個硬幣
V = 16 | 使用了1個硬幣(41 – 25 = 16)
V = 6 | 使用了2個硬幣(16 – 10 = 6)
V = 1 | 使用了3個硬幣(6 – 5 = 1)
V = 0 | 使用了4個硬幣(1 – 1 = 0)
位運算
位運算即在比特級別進行操作的技術。使用位運算技術可以帶來更快的運行速度與更小的內存使用。
測試第 k 位:s & (1 << k);
設置第k位:s |= (1 << k);
關閉第k位:s &= ~(1 << k);
切換第k位:s ^= (1 << k);
乘以2n:s << n;
除以2n:s >> n;
交集:s & t;
并集:s | t;
減法:s & ~t;
提取最小非0位:s & (-s);
提取最小0位:~s & (s + 1);
交換值:x ^= y; y ^= x; x ^= y;
運行時分析
大 O 表示
大 O 表示用于表示某個算法的上界,用于描述最壞的情況。
小 O 表示
小 O 表示用于描述某個算法的漸進上界,二者逐漸趨近。
大 Ω 表示
大 Ω 表示用于描述某個算法的漸進下界。
小 ω 表示
小 ω 表示用于描述某個算法的漸進下界,二者逐漸趨近。
Theta Θ 表示
Theta Θ 表示用于描述某個算法的確界,包括最小上界和最大下界。
以為這就結束了?No,還有 LeetCode 題目的參考解答代碼
Java 代碼目錄如下: