不一樣的List 01——ArrayList解析

List是Java中非常常用的數據結構,而ArrayList是其中最常用的實現,ArrayList正如它的名稱一樣,它的本質是一個數組,所有的元素都會以數組的形式保存在內存中,然后提供各種操作數組的方法。

初始化

既然對象要存到數組,那么肯定就需要預先分配好內存,這也是ArrayList優化的核心因素。

ArrayList提供了三個構造函數:

  1. public ArrayList()
  2. public ArrayList(int initialCapacity)
  3. public ArrayList(Collection<? extends E> c)

先來說說最簡單的無參構造方法ArrayList()

public ArrayList() {
    this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}

DEFAULTCAPACITY_EMPTY_ELEMENTDATA是一個空的數組,采用這種初始化方式,就意味著我們需要使用ArrayList的默認設置(默認不初始化數組),有意思的是在jdk1.6中,這個方法里面只是簡單地調用了一下另外一個構造方法ArrayList(10)

再來看第二種構造形式:ArrayList(int initialCapacity)

public ArrayList(int initialCapacity) {
    if (initialCapacity > 0) {
        this.elementData = new Object[initialCapacity];
    } else if (initialCapacity == 0) {
        this.elementData = EMPTY_ELEMENTDATA;
    } else {
        throw new IllegalArgumentException("Illegal Capacity:"+
                                           initialCapacity);
    }
}

它則要求用戶輸入一個值初始化大小,ArrayList根據這個值來分配數組的大小。

第三種構造方法:ArrayList(Collection<? extends E> c)則是將Collection對象轉換成數組(通過collection內置的方法),然后拷貝到ArrayList的元素中,不是一種特別高效的方式:

public ArrayList(Collection<? extends E> c) {
    elementData = c.toArray();
    if ((size = elementData.length) != 0) {
        // c.toArray might (incorrectly) not return Object[] (see 6260652)
        if (elementData.getClass() != Object[].class)
            elementData = Arrays.copyOf(elementData, size, Object[].class);
    } else {
        // replace with empty array.
        this.elementData = EMPTY_ELEMENTDATA;
    }
}

在以上的源碼中所展示的一樣,ArrayList擁有一個elementData數組對象,它所有的儲存的元素都會保存在這個對象數組中。

添加元素

在初始化這個容器之后,我們現在最需要做的就是將數據存到ArrayList里面,ArrayList提供了幾種添加元素的方法:

  1. public void add(int index, E element)
  2. public boolean add(E e)
  3. public boolean addAll(Collection<? extends E> c) // 由AbstractCollection提供,內部其實使用了add()方法
  4. public boolean addAll(int index, Collection<? extends E> c) // 由AbstractList提供,內部也是使用了add()方法

那么讓我們由最簡單的add()方法,來解析ArrayList是如何將數據存入數組的。

public boolean add(E e) {
    ensureCapacityInternal(size + 1); 
    elementData[size++] = e;
    return true;
}

這里使用一個參數size,這個參數保存了當前ArrayList中存儲元素數量。

ensureCapacityInternal(int size)函數是一個私有方法,負責確認數組是否需要擴容,以及是否需要調整參數的大小,看看它內部具體的實現:

private void ensureCapacityInternal(int minCapacity) {
    if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
        minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
    }
    
    ensureExplicitCapacity(minCapacity);
}

這個函數中,我們發現有一句特意為無參構造方法寫的if語句,DEFAULT_CAPACITY的值為10,ensureExplicitCapacity方法會判斷數組是不是真的需要擴容,然后會調用grow()函數執行真正的數組擴容。

private void ensureExplicitCapacity(int minCapacity) {
    modCount++; // 這是為迭代器快速失敗提供的一個參數,可以暫時忽略

    // overflow-conscious code
    if (minCapacity - elementData.length > 0)
        grow(minCapacity);
}

所以,這意味著如果我們初始化的是一個空的ArrayList,那么數組直到被add的時候才會擴容,相比1.6中一經初始化就占用空間,是做了一些調整的。

那么grow()方法中又是如何為數組擴容的呢:

private void grow(int minCapacity) {
    // overflow-conscious code
    int oldCapacity = elementData.length;
    int newCapacity = oldCapacity + (oldCapacity >> 1); // 右移一位,二進制中高位減少一個數量級,即除以2
    if (newCapacity - minCapacity < 0)
        newCapacity = minCapacity;
    if (newCapacity - MAX_ARRAY_SIZE > 0)
        newCapacity = hugeCapacity(minCapacity);
    // minCapacity is usually close to size, so this is a win:
    elementData = Arrays.copyOf(elementData, newCapacity);
}

從中可以看到ArrayList在確認擴容之后利用Arrays.copyOf()方法產生一個空間為原來1.5倍的新數組,并將老的數組復制到新的數組中,也就是將老的元素,整體從一個位置挪到了另外一個位置,老的數組等待被GC釋放。

在確認數組的大小能夠容納下新的元素之后,我們回到add()方法,新添加的元素添加到索引為size值的位置,然后擴大size的值。

說到擴容,ArrayList為我們提供了一個公開的方法ensureCapacity(),幫助我們手動擴容:

public void ensureCapacity(int minCapacity) {
    int minExpand = (elementData != DEFAULTCAPACITY_EMPTY_ELEMENTDATA)
        // any size if not default element table
        ? 0
        // larger than default for default empty table. It's already
        // supposed to be at default size.
        : DEFAULT_CAPACITY;

    if (minCapacity > minExpand) {
        ensureExplicitCapacity(minCapacity);
    }
}

因為擴容總是1.5倍,有時候這并非我們希望的數組大小,如果我們事先已經預知代碼執行到某一段的時候,需要擴容的操作,那么我們就可以使用ensureCapacity()方法手動擴容到期望的大小。

刪除元素

既然元素可以被添加的,那么也應該可以被刪除,ArrayList提供了幾個刪除方法:

這里我們分析下最常用的remove(int index)方法

public E remove(int index) {
    rangeCheck(index);

    modCount++;
    E oldValue = elementData(index);

    int numMoved = size - index - 1;
    if (numMoved > 0)
        System.arraycopy(elementData, index+1, elementData, index,
                             numMoved);
    elementData[--size] = null; // clear to let GC do its work

    return oldValue;
}

這個方法中,rangeCheck(index)會檢查傳入的參數是否超出數組大小越界。

之后remove()方法通過elementData()方法查詢出要被刪除的數據:

E elementData(int index) {
    return (E) elementData[index];
}

使用System.arraycopy函數復制數據覆蓋原先的索引位置上的數據,并將最后一位制空并減少size值,等待被GC回收內存。

查詢數據

ArrayList可以通過get()方法查詢數據:

public E get(int index) {
    // 檢查傳入的參數是否越界
    rangeCheck(index);
    // 從 elementData 數組中取出對應索引位置的數據,強轉成對應的類型
    return elementData(index);
}

由于是基于數組的容器,查詢的時候知道位置,數組大小可以被確定,查詢的復雜度為復雜度O(1),查詢的速度是非常快的。

當然既然是數組,更多的時候,我們需要遍歷整個數組,在Java8提供了lambda之后,ArrayList也提供了一個forEach()方法完成整個數組的遍歷:

public void forEach(Consumer<? super E> action) {
    Objects.requireNonNull(action);
    final int expectedModCount = modCount;
    
    @SuppressWarnings("unchecked")
    final E[] elementData = (E[]) this.elementData;
    final int size = this.size;
    for (int i=0; modCount == expectedModCount && i < size; i++) {
        action.accept(elementData[i]);
    }
    if (modCount != expectedModCount) {
        throw new ConcurrentModificationException();
    }
}

從中不難發現,forEach()方法遍歷數組的本質其實還是利用了最基本的for循環,然后直接通過索引位置取得數據。

總結

ArrayList作為最常用的數據結構,需要更好地了解才能更好地使用它。從以上的分析中也不難看出ArrayList最大的消耗來自于到處數組拷貝,幾乎所有操作元素的地方,都可能(對,只是可能)出現數組的拷貝,這本身是一個非常大的消耗,而大量老數組等待被GC也增加了GC的負擔。

所以使用ArrayList最好的姿勢,應該是初始化的時候,估算好數組的大小,然后將元素放入容器之后,盡量不要再做一些修改容器的操作。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 230,362評論 6 544
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 99,577評論 3 429
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 178,486評論 0 383
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,852評論 1 317
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 72,600評論 6 412
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,944評論 1 328
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,944評論 3 447
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 43,108評論 0 290
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,652評論 1 336
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 41,385評論 3 358
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,616評論 1 374
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 39,111評論 5 364
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,798評論 3 350
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 35,205評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,537評論 1 295
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 52,334評論 3 400
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,570評論 2 379

推薦閱讀更多精彩內容

  • 文章有點長,比較啰嗦,請耐心看完!(基于Android API 25) 一、概述 首先得明白ArrayList在數...
    JerryloveEmily閱讀 3,235評論 2 15
  • 一.線性表 定義:零個或者多個元素的有限序列。也就是說它得滿足以下幾個條件:??①該序列的數據元素是有限的。??②...
    Geeks_Liu閱讀 2,708評論 1 12
  • 1. Java基礎部分 基礎部分的順序:基本語法,類相關的語法,內部類的語法,繼承相關的語法,異常的語法,線程的語...
    子非魚_t_閱讀 31,737評論 18 399
  • 這里都是基于對View的屬性和方法進行學習,注意與OC的對比,另外其他的屬性和方法看他們API接口就好了 一、UI...
    天空中的球閱讀 1,310評論 0 0
  • 徜徉在將暮未暮的原野 曰月穿梭其間 四季靜默過的風 吹落一方星辰 我趕著季節的腳步 對漸變的顏色熟視無睹 流浪過萬...
    青箏閱讀 353評論 1 3