一、前言
Java集合主要分為三種類型:Set(集)、List(列表)和Map(映射)。
先簡(jiǎn)單說(shuō)下集合和數(shù)組的區(qū)別:
數(shù)組是大小固定的,并且同一個(gè)數(shù)組只能存放類型一樣的數(shù)據(jù)(基本類型/引用類型),而JAVA集合可以存儲(chǔ)和操作數(shù)目不固定的一組數(shù)據(jù)。所有的JAVA集合都位于java.util包中。 JAVA集合只能存放引用類型的的數(shù)據(jù),不能存放基本數(shù)據(jù)類型。
再來(lái)說(shuō)說(shuō)集合產(chǎn)生的原因:世間上本來(lái)沒(méi)有集合,只有數(shù)組(c語(yǔ)言)。
有人想有可以自動(dòng)擴(kuò)展的數(shù)組,所以有了List。
有的人想有沒(méi)有不重復(fù)的數(shù)組,所以有了set。
有人想有自動(dòng)排序的組數(shù),所以有了TreeSet、TreeList、Tree**。
而幾乎所有的集合都是基于數(shù)組來(lái)實(shí)現(xiàn)的。因?yàn)榧鲜菍?duì)數(shù)組做的封裝,所以數(shù)組永遠(yuǎn)比任何一個(gè)集合要快。但任何一個(gè)集合,比數(shù)組提供的功能要多。
1、數(shù)組聲明了它容納的元素的類型,而集合不聲明。這是由于集合以O(shè)bject形式來(lái)存儲(chǔ)它們的元素。
2、一個(gè)數(shù)組實(shí)例具有固定的大小,不能伸縮。集合則可根據(jù)需要?jiǎng)討B(tài)改變大小。
3、數(shù)組是一種可讀/可寫數(shù)據(jù)結(jié)構(gòu),沒(méi)有辦法創(chuàng)建一個(gè)只讀數(shù)組。然而可以使用集合提供的ReadOnly方法,以只讀方式來(lái)使用集合。該方法將返回一個(gè)集合的只讀版本。
下面具體說(shuō)下集合(Collection:List、Set,Map:HashMap、TreeMap)
二、細(xì)說(shuō)Java集合
2.1、Collection接口
Collection是最基本的集合接口,聲明了適用于JAVA集合(只包括Set和List)的通用方法。 Set 和List 都繼承了Conllection。
2.1.1、Collection接口的方法:
boolean add(Object o) :向集合中加入一個(gè)對(duì)象的引用
void?clear():刪除集合中所有的對(duì)象,即不再持有這些對(duì)象的引用
boolean?isEmpty():判斷集合是否為空
boolean?contains(Object?o) :判斷集合中是否持有特定對(duì)象的引用
Iterartor?iterator() :返回一個(gè)Iterator對(duì)象,可以用來(lái)遍歷集合中的元素
boolean?remove(Object?o)?:從集合中刪除一個(gè)對(duì)象的引用
int?size()?:返回集合中元素的數(shù)目
Object[]?toArray():返回一個(gè)數(shù)組,該數(shù)組中包括集合中的所有元素
注意:Iterator() 和toArray() 方法都用于集合的所有的元素,前者返回一個(gè)Iterator對(duì)象,后者返回一個(gè)包含集合中所有元素的數(shù)組。
Iterator接口聲明了如下方法:
hasNext():判斷集合中元素是否遍歷完畢,如果沒(méi)有,就返回true
next()?:返回下一個(gè)元素
remove():從集合中刪除上一個(gè)有next()方法返回的元素
2.2、Set(集合)
Set是最簡(jiǎn)單的一種集合。集合中的對(duì)象不按特定的方式排序,并且沒(méi)有重復(fù)對(duì)象。 Set接口主要實(shí)現(xiàn)了兩個(gè)實(shí)現(xiàn)類:
HashSet: HashSet類按照哈希算法來(lái)存取集合中的對(duì)象,存取速度比較快
TreeSet :TreeSet類實(shí)現(xiàn)了SortedSet接口,能夠?qū)现械膶?duì)象進(jìn)行排序。
Set 的用法:存放的是對(duì)象的引用,沒(méi)有重復(fù)對(duì)象。
Set set = newHashSet();
String?s1=newString("hello");
String?s2 = s1;
String?s3 = newString("world");
set.add(s1);
set.add(s2);
set.add(s3);
System.out.println(set.size()); ?// 打印集合中對(duì)象的數(shù)目?為?2。
Set 的add()方法是如何判斷對(duì)象是否已經(jīng)存放在集合中?
booleanisExists = false;
Iterator?iterator = set.iterator();
while(it.hasNext()) ?{
? ? ? ? String?oldStr = it.next();
? ? ? ? if(newStr.equals(oldStr)){
? ? ? ? ? ? ? ? isExists=true;
? ? ? ? }
}
Set的功能方法:
Set具有與Collection完全一樣的接口,因此沒(méi)有任何額外的功能,不像前面有兩個(gè)不同的List。實(shí)際上Set就是Collection,只是行為不同(這是繼承與多態(tài)思想的典型應(yīng)用:表現(xiàn)不同的行為)。Set不保存重復(fù)的元素。
Set:存入Set的每個(gè)元素都必須是唯一的,因?yàn)镾et不保存重復(fù)元素。加入Set的元素必須定義equals()方法以確保對(duì)象的唯一性。Set與Collection有完全一樣的接口。Set接口不保證維護(hù)元素的次序。
HashSet:為快速查找設(shè)計(jì)的Set。存入HashSet的對(duì)象必須定義hashCode()。
TreeSet: 保存次序的Set, 底層為樹(shù)結(jié)構(gòu)。使用它可以從Set中提取有序的序列。
LinkedHashSet:具有HashSet的查詢速度,且內(nèi)部使用鏈表維護(hù)元素的順序(插入的次序)。于是在使用迭代器遍歷Set時(shí),結(jié)果會(huì)按元素插入的次序顯示。
2.3、List(列表)
List的特征是其元素以線性方式存儲(chǔ),集合中可以存放重復(fù)對(duì)象。
List接口主要實(shí)現(xiàn)類包括:
ArrayList() : 代表長(zhǎng)度可以改變得數(shù)組。可以對(duì)元素進(jìn)行隨機(jī)的訪問(wèn),向ArrayList()中插入與刪除元素的速度慢。
LinkedList(): 在實(shí)現(xiàn)中采用鏈表數(shù)據(jù)結(jié)構(gòu)。插入和刪除速度快,訪問(wèn)速度慢。
對(duì)于List的隨機(jī)訪問(wèn)來(lái)說(shuō),就是只隨機(jī)來(lái)檢索位于特定位置的元素。 List 的 get(int index) 方法放回集合中由參數(shù)index指定的索引位置的對(duì)象,下標(biāo)從“0” 開(kāi)始。最基本的兩種檢索集合中的所有對(duì)象的方法:
1、for循環(huán)和get()方法:
for(int i=0; i<list.size(); i++){
? ? ? ? System.out.println(list.get(i));
}
2、使用 迭代器(Iterator):
Iterator?it = list.iterator();
while(it.hashNext()){
? ? ? ? System.out.println(it.next());
}
兩種List的功能方法:一種是基本的ArrayList,其優(yōu)點(diǎn)在于隨機(jī)訪問(wèn)元素;另一種是更強(qiáng)大的LinkedList,它并不是為快速隨機(jī)訪問(wèn)設(shè)計(jì)的,而是具有一套更通用的方法。
List:次序是List最重要的特點(diǎn),它保證維護(hù)元素特定的順序。List為Collection添加了許多方法,使得能夠向List中間插入與移除元素。一個(gè)List可以生成ListIterator,使用它可以從兩個(gè)方向遍歷List,也可以從List中間插入和移除元 素。
ArrayList:由數(shù)組實(shí)現(xiàn)的List。允許對(duì)元素進(jìn)行快速隨機(jī)訪問(wèn),但是向List中間插入與移除元素的速度很慢。ListIterator只應(yīng)該用來(lái)由后向前遍歷 ArrayList,而不是用來(lái)插入和移除元素,因?yàn)槟潜萀inkedList開(kāi)銷要大很多。
LinkedList:對(duì)順序訪問(wèn)進(jìn)行了優(yōu)化,向List中間插入與刪除的開(kāi)銷并不大。隨機(jī)訪問(wèn)則相對(duì)較慢。(使用ArrayList代替。)還具有下列方 法:addFirst(), addLast(), getFirst(), getLast(), removeFirst() 和 removeLast(),,這些方法 (沒(méi)有在任何接口或基類中定義過(guò))使得LinkedList可以當(dāng)作堆棧、隊(duì)列和雙向隊(duì)列使用。
2.4、Map(映射)
Map 是一種把鍵對(duì)象和值對(duì)象映射的集合,它的每一個(gè)元素都包含一對(duì)鍵對(duì)象和值對(duì)象。 Map沒(méi)有繼承于Collection接口。從Map集合中檢索元素時(shí),只要給出鍵對(duì)象,就會(huì)返回對(duì)應(yīng)的值對(duì)象。
Map的常用方法:
1、添加,刪除操作:
Object?put(Object?key,?Object?value):?向集合中加入元素
Object?remove(Object?key):?刪除與KEY相關(guān)的元素
void?putAll(Map?t):??將來(lái)自特定映像的所有元素添加給該映像
void?clear():從映像中刪除所有映射
2、查詢操作:
Object get(Object key):獲得與關(guān)鍵字key相關(guān)的值 。Map集合中的鍵對(duì)象不允許重復(fù),也就說(shuō),任意兩個(gè)鍵對(duì)象通過(guò)equals()方法比較的結(jié)果都是false,但是可以將任意多個(gè)鍵獨(dú)享映射到同一個(gè)值對(duì)象上。
3、Map的功能方法:
方法put(Object key, Object value)添加一個(gè)“值”(想要得東西)和與“值”相關(guān)聯(lián)的“鍵”(key)(使用它來(lái)查找)。方法get(Object key)返回與給定“鍵”相關(guān)聯(lián)的“值”。
標(biāo)準(zhǔn)的Java類庫(kù)中包含了幾種不同的Map:HashMap,TreeMap、LinkedHashMap、WeakHashMap、IdentityHashMap。它們都有同樣的基本接口Map,但是行為、效率、排序策略、保存對(duì)象的生命周期和判定“鍵”等價(jià)的策略等各不相同。
提高執(zhí)行效率是Map的一個(gè)大優(yōu)勢(shì)。看看get()要做哪些事,就會(huì)明白為什么在ArrayList中搜索“鍵”是相當(dāng)慢的。而這正是HashMap提高速度的地方。HashMap使用了特殊的值,稱為“散列碼”(hash code),來(lái)取代對(duì)鍵的緩慢搜索。“散列碼”是“相對(duì)唯一”用以代表對(duì)象的int值,它是通過(guò)將該對(duì)象的某些信息進(jìn)行轉(zhuǎn)換而生成的。所有Java對(duì)象都能產(chǎn)生散列碼,因?yàn)閔ashCode()是定義在基類Object中的方法。
HashMap就是使用對(duì)象的hashCode()進(jìn)行快速查詢的。此方法能夠顯著提高性能。
Map:維護(hù)“鍵值對(duì)”的關(guān)聯(lián)性,使你可以通過(guò)“鍵”查找“值”。
HashMap:Map基于散列表的實(shí)現(xiàn)。插入和查詢“鍵值對(duì)”的開(kāi)銷是固定的。可以通過(guò)構(gòu)造器設(shè)置容量capacity和負(fù)載因子load factor,以調(diào)整容器的性能。
LinkedHashMap:類似于HashMap,但是迭代遍歷它時(shí),取得“鍵值對(duì)”的順序是其插入次序,或者是最近最少使用(LRU)的次序。只比HashMap慢一點(diǎn)。而在迭代訪問(wèn)時(shí)發(fā)而更快,因?yàn)樗褂面湵砭S護(hù)內(nèi)部次序。
TreeMap:基于紅黑樹(shù)數(shù)據(jù)結(jié)構(gòu)的實(shí)現(xiàn)。查看“鍵”或“鍵值對(duì)”時(shí),它們會(huì)被排序(次序由Comparabel或Comparator決定)。TreeMap的特點(diǎn)在 于,你得到的結(jié)果是經(jīng)過(guò)排序的。TreeMap是唯一的帶有subMap()方法的Map,它可以返回一個(gè)子樹(shù)。
WeakHashMao :弱鍵(weak key)Map,Map中使用的對(duì)象也被允許釋放: 這是為解決特殊問(wèn)題設(shè)計(jì)的。如果沒(méi)有map之外的引用指向某個(gè)“鍵”,則此“鍵”可以被垃圾收集器回收。
IdentifyHashMap:使用==代替equals()對(duì)“鍵”作比較的hash map。專為解決特殊問(wèn)題而設(shè)計(jì)。
三、它們的區(qū)別
3.1、Collection和Map的區(qū)別
容器內(nèi)每個(gè)為之所存儲(chǔ)的元素個(gè)數(shù)不同。Collection類型,每個(gè)位置只有一個(gè)元素。Map類型,持有 key-value pair,像個(gè)小型數(shù)據(jù)庫(kù)(比如現(xiàn)在很火的MongoDB就是key-value)。
3.2、特征說(shuō)明
List,Set,Map將持有對(duì)象一律視為Object型別。
Collection、List、Set、Map都是接口,不能實(shí)例化。
繼承自它們的 ArrayList、Vector、HashTable、HashMap是具象class,這些才可被實(shí)例化。vector容器確切知道它所持有的對(duì)象隸屬什么型別。vector不進(jìn)行邊界檢查。
List:將以特定次序存儲(chǔ)元素,所以取出來(lái)的順序可能和放入順序不同。
Set : 不能含有重復(fù)的元素。
四、總結(jié)
1、如果涉及到堆棧,隊(duì)列等操作,應(yīng)該考慮用List,對(duì)于需要快速插入,刪除元素,應(yīng)該使用LinkedList,如果需要快速隨機(jī)訪問(wèn)元素,應(yīng)該使用ArrayList。
2、如果程序在單線程環(huán)境中,或者訪問(wèn)僅僅在一個(gè)線程中進(jìn)行,考慮非同步的類,其效率較高,如果多個(gè)線程可能同時(shí)操作一個(gè)類,應(yīng)該使用同步的類。
3、在除需要排序時(shí)使用TreeSet、TreeMap外,都應(yīng)使用HashSet、HashMap,因?yàn)樗麄兊男矢摺?/p>
4、要特別注意對(duì)哈希表的操作,作為key的對(duì)象要正確復(fù)寫equals和hashCode方法。
5、容器類僅能持有對(duì)象引用(指向?qū)ο蟮闹羔槪皇菍?duì)象信息copy一份至數(shù)列某位置。一旦將對(duì)象置入容器內(nèi),便損失了該對(duì)象的型別信息。
6、盡量返回接口而非實(shí)際的類型,如返回List而非ArrayList,這樣如果以后需要將ArrayList換成LinkedList時(shí),客戶端代碼不用改變。這就是針對(duì)抽象編程。
注意:
1、Collection沒(méi)有g(shù)et()方法來(lái)取得某個(gè)元素。只能通過(guò)iterator()遍歷元素。
2、Set和Collection擁有一模一樣的接口。
3、List可以通過(guò)get()方法來(lái)一次取出一個(gè)元素。
4、一般使用ArrayList。用LinkedList構(gòu)造堆棧stack、隊(duì)列queue。
5、Map用 put(k,v) / get(k),還可以使用containsKey()/containsValue()來(lái)檢查其中是否含有某個(gè)key/value。HashMap會(huì)利用對(duì)象的hashCode來(lái)快速找到key。
本文內(nèi)容參考于網(wǎng)上的一篇博客,不過(guò)那篇博客可讀性太差啦。