HashMap是Android程序員（當然也包括Java程序員）經常使用的映射數據類型，伴隨著JDK的版本更新,JDK1.8相比1.7對HashMap的底層實現了一些優化，尤其是紅黑樹這個點（現在面試的時候基本都會問到這個問題），本博文結合JDK1.8源碼分析下HashMap的實現原理。

1.簡介

1.1 哈希算法

什么是哈希算法呢？

哈希算法將任意長度的二進制值映射為較短的固定長度的二進制值，這個小的二進制值稱為哈希值。哈希值是一段數據唯一且極其緊湊的數值表示形式。如果散列一段明文而且哪怕只更改該段落的一個字母，隨后的哈希都將產生不同的值。要找到散列為同一個值的兩個不同的輸入，在計算上是不可能的，所以數據的哈希值可以檢驗數據的完整性。一般用于快速查找和加密算法。

1.2 解決hash沖突

HashMap使用鏈地址法來解決hash沖突，即數組+鏈表的組合，JDK1.8之后才引入了紅黑樹進行存儲優化。
每個數組元素上都是一個鏈表結構，當數據被hash后得到數組的下標，把數據存儲到對應下標的鏈表上。

1.3 HashMap定義

public class HashMap<K,V> extends AbstractMap，<K,V>
    implements Map<K,V>, Cloneable, Serializable

從HashMap的定義上，我們可以知道以下幾點：

HashMap為散列表，用于存儲[key-value]鍵值對
繼承了AbstractMap，實現了Map、Cloneable、Serializable
由于Map的設計是非同步的，從實現上看HashMap也是非線程安全的。（線程同步的場景可以使用ConcurrentHashMap）
可以實現克隆
可以序列化

1.4 一些屬性

    // 初始化容量，必須為2的n次冪（主要是為了后續計算index考慮）
    static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
 
    // 最大容量，2的30次冪 
    static final int MAXIMUM_CAPACITY = 1 << 30;

    // 默認的加載因子，size=capacity*factor
    static final float DEFAULT_LOAD_FACTOR = 0.75f;

    // 使用紅黑樹的閥值
    // 當鏈表中的個數大于該值時，會將鏈表轉換為紅黑樹進行存儲
    // 該值必須大于2，且最小值為8
    static final int TREEIFY_THRESHOLD = 8;

    // resize時不使用樹的閥值，必須小于TREEIFY_THRESHOLD
    static final int UNTREEIFY_THRESHOLD = 6;

    // 紅黑樹最小容量
    // 最小值為:4 * TREEIFY_THRESHOLD
    static final int MIN_TREEIFY_CAPACITY = 64;

1.5 重要的Node

// 用于存儲數據的節點
static class Node<K,V> implements Map.Entry<K,V> {
        // 用于定位數組索引位置
        final int hash;
        // 存儲的key
        final K key;
        // 存儲的value
        V value;
        // 鏈表中下一個值
        Node<K,V> next;

        Node(int hash, K key, V value, Node<K,V> next) {
            this.hash = hash;
            this.key = key;
            this.value = value;
            this.next = next;
        }

        public final K getKey()        { return key; }
        public final V getValue()      { return value; }
        public final String toString() { return key + "=" + value; }

        public final int hashCode() {
            return Objects.hashCode(key) ^ Objects.hashCode(value);
        }

        public final V setValue(V newValue) {
            V oldValue = value;
            value = newValue;
            return oldValue;
        }

        public final boolean equals(Object o) {
            if (o == this)
                return true;
            if (o instanceof Map.Entry) {
                Map.Entry<?,?> e = (Map.Entry<?,?>)o;
                if (Objects.equals(key, e.getKey()) &&
                    Objects.equals(value, e.getValue()))
                    return true;
            }
            return false;
        }
    }

Node是HashMap的一個靜態內部類，實現了Map.Entry接口，本質是就是一個鍵值對。

1.6 構造方法

在看構造方法前，先來看幾個關鍵的屬性：

    // 存儲數據的數據，首次使用時被初始化，需要時可以被擴容
    // 當分配時它的長度一定是2的n次冪
    transient Node<K,V>[] table;

    // 數組中實際存儲的鍵值對數量
    transient int size;

    //  用于fail-fast
    transient int modCount;
    // HashMap所能容納的最大數據量的Node(鍵值對)個數
    // threshold = capacity * load factor
    // 超過該值那么將進行擴容
    int threshold;

    // 負載因子
    final float loadFactor;

下面我們來看下HashMap的幾個構造方法：

    public HashMap(int initialCapacity, float loadFactor) {
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal initial capacity: " +
                                               initialCapacity);
        if (initialCapacity > MAXIMUM_CAPACITY)
            initialCapacity = MAXIMUM_CAPACITY;
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal load factor: " +
                                               loadFactor);
        this.loadFactor = loadFactor;
        this.threshold = tableSizeFor(initialCapacity);
    }

    public HashMap(int initialCapacity) {
        this(initialCapacity, DEFAULT_LOAD_FACTOR);
    }

    public HashMap() {
        this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
    }

    public HashMap(Map<? extends K, ? extends V> m) {
        this.loadFactor = DEFAULT_LOAD_FACTOR;
        putMapEntries(m, false);
    }

這些構造方法其實就是對上面的幾個屬性進行了初始化。

2.原理分析

2.1 確定在Hash數組中的index

方法一：

static final int hash(Object key) {
    int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
    
方法二：
static int indexFor(int h, int length) {  //jdk1.7的源碼，jdk1.8沒有這個方法，但是實現原理一樣的
  return h & (length-1);  //第三步 取模運算
}

分析下上面的兩個算法，我們可以發現HashMap采用的hash算法主要包括以下三塊內容：

取得key的hashCode值
在這里我們需要明確下hashCode()方法與equals()方法之間的關系：
如果x.equals(y)返回“true”，那么x和y的hashCode()必須相等。
如果x.equals(y)返回“false”，那么x和y的hashCode()有可能相等，也有可能不等。
高位運算

(h = key.hashCode()) ^ (h >>> 16)

這么做可以在數組table的length比較小的時候，也能保證考慮到高低Bit都參與到Hash的計算中，同時不會有太大的開銷。

取模運算
這個方法非常巧妙，它通過h&(table.length-1)來得到對象的保存位置（數組中的index），因為數組的長度lenth總是為2的n次方，h&(length-1)運算等價于對length取模，也就是h%length，但是&比%具有更高的效率。

2.2 put方法

上面分析了這么多，這個章節才是我們的重點，廢話不多說，我們來看put方法到底做了那些神級操作。

public V put(K key, V value) {
        return putVal(hash(key), key, value, false, true);
    }
    
     final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        //1. 如果是首次使用（tab為空），那么進行resize操作
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
            
        //2.根據hash值獲得數組index值，判斷table[index]是否為null
        //如果table[index]為null，直接新建node元素。
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        else {
            Node<K,V> e; K k;
            // 3. 節點key存在，直接進行覆蓋
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
                
            // 4.如果當前table[index]為紅黑樹節點對象，存儲節點到書中
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
                
            // 5.如果節點為鏈表    
            else {
                for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        // 如果鏈表長度大于等于8，則將鏈表轉換為紅黑樹
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    // key已經存在直接覆蓋value
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            
            // tab
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        // 6.超過最大容量，就進行擴容
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }

2.3 resize

 final Node<K,V>[] resize() {
        Node<K,V>[] oldTab = table;
        int oldCap = (oldTab == null) ? 0 : oldTab.length;
        int oldThr = threshold;
        int newCap, newThr = 0;
        if (oldCap > 0) {
            // 超過最大值就不再進行擴容了
            if (oldCap >= MAXIMUM_CAPACITY) {
                threshold = Integer.MAX_VALUE;
                return oldTab;
            }
            
            // 沒有超過最大值，就擴大為原來的2倍
            else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                     oldCap >= DEFAULT_INITIAL_CAPACITY)
                newThr = oldThr << 1; // double threshold
        }
        else if (oldThr > 0) // initial capacity was placed in threshold
            newCap = oldThr;
        else {               // zero initial threshold signifies using defaults
            // 首次使用時進行的擴容
            newCap = DEFAULT_INITIAL_CAPACITY;
            newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
        }
        
        // 計算新的上限
        if (newThr == 0) {
            float ft = (float)newCap * loadFactor;
            newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                      (int)ft : Integer.MAX_VALUE);
        }
        threshold = newThr;
        
        @SuppressWarnings({"rawtypes","unchecked"})
            Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
        table = newTab;
        if (oldTab != null) {
            for (int j = 0; j < oldCap; ++j) {
                Node<K,V> e;
                
                // 將每個bucket移動到新的bucket
                if ((e = oldTab[j]) != null) {
                    // 將舊的數組置為null
                    oldTab[j] = null;
                    
                    if (e.next == null)
                        newTab[e.hash & (newCap - 1)] = e;
                    else if (e instanceof TreeNode)
                        ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                    else { // preserve order
                        Node<K,V> loHead = null, loTail = null;
                        Node<K,V> hiHead = null, hiTail = null;
                        Node<K,V> next;
                        do {
                            next = e.next;
                            
                            // 原索引
                            if ((e.hash & oldCap) == 0) {
                                if (loTail == null)
                                    loHead = e;
                                else
                                    loTail.next = e;
                                loTail = e;
                            }
                             // 原索引+oldCap
                            else {
                                if (hiTail == null)
                                    hiHead = e;
                                else
                                    hiTail.next = e;
                                hiTail = e;
                            }
                        } while ((e = next) != null);
                        
                        // 原索引放到bucket里
                        if (loTail != null) {
                            loTail.next = null;
                            newTab[j] = loHead;
                        }
                        
                        // 原索引+oldCap放到bucket里
                        if (hiTail != null) {
                            hiTail.next = null;
                            newTab[j + oldCap] = hiHead;
                        }
                    }
                }
            }
        }
        return newTab;
    }

3. 線程安全性

我們都知道HashMap是非線程安全的，在多線程使用場景中，應該盡量避免使用線程不安全的HashMap，而使用線程安全的ConcurrentHashMap。
ConcurrentHashMap使用了分段加鎖的機制，因此在使用效率上比使用HashTable和Collections.synchronizedMap()更高，而且由于設計陳舊，HashTable和Collections.synchronizedMap()正在逐漸退出歷史舞臺。

4. 結束語

HashMap在我們日常開發中，占據著不可或缺的位置，希望大家能對其原理有一個深入的認識和了解。JDK 1.8對HashMap的優化僅僅是冰山一角，讓我們通過HashMap開始擁抱JDK1.8吧。

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

HashMap-你可能需要知道這些

HashMap-你可能需要知道這些

1.簡介

1.1 哈希算法

1.2 解決hash沖突

1.3 HashMap定義

1.4 一些屬性

1.5 重要的Node

1.6 構造方法

2.原理分析

2.1 確定在Hash數組中的index

2.2 put方法

2.3 resize

3. 線程安全性

4. 結束語

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

HashMap-你可能需要知道這些

1.簡介

1.1 哈希算法

1.2 解決hash沖突

1.3 HashMap定義

1.4 一些屬性

1.5 重要的Node

1.6 構造方法

2.原理分析

2.1 確定在Hash數組中的index

2.2 put方法

2.3 resize

3. 線程安全性

4. 結束語

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频