首先這四個大致可以分為兩類,第一類是 List 和 Array(數組),第二類是 Dictionary 和 Hashtable
-
List 和 Array(數組)
在初始化List之前最好對List初始化大小。在初始化 List 時,List 會新建一個數組,然后把數組的長度設置為原來的二倍(如果原有的數組長度為0,那就默認將數組的長度設置為4)。List<T> 是對 Array 的進一步封裝,說得再直接點,可以理解 List<T> 為 Array 的可擴充版本,然后擴展了一些方法。
List 是基于 Array 存在的,因此,在創建一個 List 對象時,需要耗費比 Array 相對更多的時間,以及更大的空間,因為 List 除了初始化內部的 items 外還需要初始化一些其他的屬性。而且在方法調用時,List需要的是再去調用Array的相關方法,因此也許會存在方法調用的時間消耗問題。
如果初始化時確定大小,那么就使用 Array。如果初始化時不確定大小,那么就使用 List。當然,其實完全可以自己去實現List中的數組擴充功能的,也許會更棒,因為我們沒有必要去將Array每次都擴充為原來的二倍。
Array 相對于 List 還有個優勢就是:多維數組比List的嵌套更容易理解,也就是說 int[][](或者是 int[,] )要強于 List<list>,也就說在類型確定且多維的情況下,用 Array 要優于 List。
-
Dictionary 和 Hashtable
首先很多人都認同一個觀點,說Dictionary<T1,T2>是HashTable的泛型版本,這一點在大致上是正確的。
Hashtable 是線程安全的,而 Dictionary 明顯不具備如此特性。單線程程序中推薦使用 Dictionary, 有泛型優勢, 且讀取速度較快, 容量利用更充分。
Dictionary<T1,T2> 是根據插入的順序來遍歷,但是 Hashtable 在插入時會打亂其位置。
HashTable 與 Dictionary 的存儲原理是相同的。 都是根據 Key 通過 Hash 計算來得到其應存放的虛擬內存地址,這也是在哈希表中 Key 必須唯一的原因,當我們按照 Key 進行查找時,首先就是根據 Key 計算出其所存放的虛擬內存地址,去對應的內存地址找數據,得到其 Value。
-
Dictionary 和 List
List<T> 是對數組做了一層包裝,我們在數據結構上稱之為線性表,而線性表的概念是,在內存中的連續區域,除了首節點和尾節點外,每個節點都有著其唯一的前驅結點和后續節點。我們在這里關注的是連續這個概念。
而 HashTable 或者 Dictionary,他是根據 Key 而根據 Hash 算法分析產生的內存地址,因此在宏觀上是不連續的,雖然微軟對其算法也進行了很大的優化。
由于這樣的不連續,在遍歷時,Dictionary 必然會產生大量的內存換頁操作,而List只需要進行最少的內存換頁即可,這就是 List 和 Dictionary 在遍歷時效率差異的根本原因。而且在尾部插入時,List 只需要在其原有的地址基礎上向后延續存儲即可,而 Dictionary 卻需要經過復雜的 Hash
計算,這也是性能損耗的地方。