LRU緩存算法

一、什么是緩存

這里說的緩存是一種廣義的概念,在計算機存儲層次結構中,低一層的存儲器都可以看做是高一層的緩存。比如Cache是內存的緩存,內存是硬盤的緩存,硬盤是網絡的緩存等等。

緩存可以有效地解決存儲器性能與容量的這對矛盾,但絕非看上去那么簡單。如果緩存算法設計不當,非但不能提高訪問速度,反而會使系統變得更慢。

從本質上來說,緩存之所以有效是因為程序和數據的局部性(locality)。程序會按固定的順序執行,數據會存放在連續的內存空間并反復讀寫。這些特點使得我們可以緩存那些經常用到的數據,從而提高讀寫速度。

緩存的大小是固定的,它應該只保存最常被訪問的那些數據。然而未來不可預知,我們只能從過去的訪問序列做預測,于是就有了各種各樣的緩存替換策略。本文介紹一種簡單的緩存策略,稱為最近最少使用(LRU,Least Recently Used)算法。

二、LRU的實現

我們以內存訪問為例解釋緩存的工作原理。假設緩存的大小固定,初始狀態為空。每發生一次讀內存操作,首先查找待讀取的數據是否存在于緩存中,若是,則緩存命中,返回數據;若否,則緩存未命中,從內存中讀取數據,并把該數據添加到緩存中。向緩存添加數據時,如果緩存已滿,則需要刪除訪問時間最早的那條數據,這種更新緩存的方法就叫做LRU。

實現LRU時,我們需要關注它的讀性能和寫性能,理想的LRU應該可以在O(1)的時間內讀取一條數據或更新一條數據,也就是說讀寫的時間復雜度都是O(1)。

此時很容易想到使用HashMap,根據數據的鍵訪問數據可以達到O(1)的速度。但是更新緩存的速度卻無法達到O(1),因為需要確定哪一條數據的訪問時間最早,這需要遍歷所有緩存才能找到。

因此,我們需要一種既按訪問時間排序,又能在常數時間內隨機訪問的數據結構。

這可以通過HashMap+雙向鏈表實現。HashMap保證通過key訪問數據的時間為O(1),雙向鏈表則按照訪問時間的順序依次穿過每個數據。之所以選擇雙向鏈表而不是單鏈表,是為了可以從中間任意結點修改鏈表結構,而不必從頭結點開始遍歷。

如下圖所示,黑色部分為HashMap的結構,紅色箭頭則是雙向鏈表的正向連接(逆向連接未畫出)??梢郧逦乜吹?,數據的訪問順序是1->3->5->6->10。我們只需要在每次訪問過后改變鏈表的連接順序即可。

HashMap+雙向鏈表

實現代碼如下:

/**
 * @author wjg
 * 
 * LRU(Least Recently Used)緩存算法
 * 使用HashMap+雙向鏈表,使get和put的時間復雜度達到O(1)。
 * 讀緩存時從HashMap中查找key,更新緩存時同時更新HashMap和雙向鏈表,雙向鏈表始終按照訪問順序排列。
 *
 */
public class LRUCache {

    /**
     * @param args
     * 測試程序,訪問順序為[[1,1],[2,2],[1],[3,3],[2],[4,4],[1],[3],[4]],其中成對的數調用put,單個數調用get。
     * get的結果為[1],[-1],[-1],[3],[4],-1表示緩存未命中,其它數字表示命中。
     */
    public static void main(String[] args) {
        
        LRUCache cache = new LRUCache(2);
        cache.put(1, 1);
        cache.put(2, 2);
        System.out.println(cache.get(1));
        cache.put(3, 3);
        System.out.println(cache.get(2));
        cache.put(4, 4);
        System.out.println(cache.get(1));
        System.out.println(cache.get(3));
        System.out.println(cache.get(4));

    }
    
    // 緩存容量
    private final int capacity;
    // 用于加速緩存項隨機訪問性能的HashMap
    private HashMap<Integer, Entry> map;
    // 雙向鏈表頭結點,該側的緩存項訪問時間較早
    private Entry head;
    // 雙向鏈表尾結點,該側的緩存項訪問時間較新
    private Entry tail;

    public LRUCache(int capacity) {
        this.capacity = capacity;
        map = new HashMap<Integer, Entry>((int)(capacity / 0.75 + 1), 0.75f);
        head = new Entry(0, 0);
        tail = new Entry(0, 0);
        head.next = tail;
        tail.prev = head;
    }
    
    /**
     * 從緩存中獲取key對應的值,若未命中則返回-1
     * @param key 鍵
     * @return key對應的值,若未命中則返回-1
     */
    public int get(int key) {
        if (map.containsKey(key)) {
            Entry entry = map.get(key);
            popToTail(entry);
            return entry.value;
        }
        return -1;
    }
    
    /**
     * 向緩存中插入或更新值
     * @param key 待更新的鍵
     * @param value 待更新的值
     */
    public void put(int key, int value) {
        if (map.containsKey(key)) {
            Entry entry = map.get(key);
            entry.value = value;
            popToTail(entry);
        }
        else {
            Entry newEntry = new Entry(key, value);
            if (map.size() >= capacity) {
                Entry first = removeFirst();
                map.remove(first.key);
            }
            addToTail(newEntry);
            map.put(key, newEntry);
        }
    }
    
    /**
     * 緩存項的包裝類,包含鍵、值、前驅結點、后繼結點
     * @author wjg
     *
     */
    class Entry {
        int key;
        int value;
        Entry prev;
        Entry next;
        
        Entry(int key, int value) {
            this.key = key;
            this.value = value;
        }
    }
    
    // 將entry結點移動到鏈表末端
    private void popToTail(Entry entry) {
        Entry prev = entry.prev;
        Entry next = entry.next;
        prev.next = next;
        next.prev = prev;
        Entry last = tail.prev;
        last.next = entry;
        tail.prev = entry;
        entry.prev = last;
        entry.next = tail;
    }
    
    // 移除鏈表首端的結點
    private Entry removeFirst() {
        Entry first = head.next;
        Entry second = first.next;
        head.next = second;
        second.prev = head;
        return first;
    }
    
    // 添加entry結點到鏈表末端
    private void addToTail(Entry entry) {
        Entry last = tail.prev;
        last.next = entry;
        tail.prev = entry;
        entry.prev = last;
        entry.next = tail;
    }

}

每個方法和成員變量前都有中文注釋,不必過多解釋。

值得一提的是,Java API中其實已經有數據類型提供了我們需要的功能,就是LinkedHashMap這個類。該類內部也是采用HashMap+雙向鏈表實現的。使用這個類實現LRU就簡練多了。

/**
 * 
 * 一個更簡單實用的LRUCache方案,使用LinkedHashMap即可實現。
 * LinkedHashMap提供了按照訪問順序排序的方案,內部也是使用HashMap+雙向鏈表。
 * 只需要重寫removeEldestEntry方法,當該方法返回true時,LinkedHashMap會刪除最舊的結點。
 * 
 * @author wjg
 *
 */
public class LRUCacheSimple {

    /**
     * @param args
     */
    public static void main(String[] args) {
        LRUCacheSimple cache = new LRUCacheSimple(2);
        cache.put(1, 1);
        cache.put(2, 2);
        System.out.println(cache.get(1));
        cache.put(3, 3);
        System.out.println(cache.get(2));
        cache.put(4, 4);
        System.out.println(cache.get(1));
        System.out.println(cache.get(3));
        System.out.println(cache.get(4));
    }
    
    private LinkedHashMap<Integer, Integer> map;
    private final int capacity;
    public LRUCacheSimple(int capacity) {
        this.capacity = capacity;
        map = new LinkedHashMap<Integer, Integer>(capacity, 0.75f, true){
            protected boolean removeEldestEntry(Map.Entry eldest) {
                return size() > capacity;
            }
        };
    }
    public int get(int key) {
        return map.getOrDefault(key, -1);
    }
    public void put(int key, int value) {
        map.put(key, value);
    }

}

只需要覆寫LinkedHashMap的removeEldestEntry方法,在緩存已滿的情況下返回true,內部就會自動刪除最老的元素。

感興趣的同學可以做一下LeetCode 146. LRU Cache這道題,嘗試一下如何實現這個算法。

完整版代碼LRUCache.java收錄在GitHub倉庫Algorithms中,歡迎大家下載試用。

參考資料

Cache replacement policies WikiPedia
146. LRU Cache LeetCode
Laziest implementation: Java's LinkedHashMap takes care of everything sky-xu

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 229,885評論 6 541
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 99,312評論 3 429
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事?!?“怎么了?”我有些...
    開封第一講書人閱讀 177,993評論 0 383
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,667評論 1 317
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 72,410評論 6 411
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,778評論 1 328
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,775評論 3 446
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,955評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,521評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 41,266評論 3 358
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,468評論 1 374
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,998評論 5 363
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,696評論 3 348
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 35,095評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,385評論 1 294
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 52,193評論 3 398
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,431評論 2 378

推薦閱讀更多精彩內容

  • 1. LRU 1.1.原理 LRU(Leastrecentlyused,最近最少使用)算法根據數據的歷史訪問記錄來...
    安易學車閱讀 2,555評論 0 23
  • Android緩存淺析 By吳思博 1、引言 2、常見的幾種緩存算法 3、Android緩存的機制 4、LruCa...
    吳小博Toby閱讀 2,928評論 1 5
  • 理論總結 它要解決什么樣的問題? 數據的訪問、存取、計算太慢、太不穩定、太消耗資源,同時,這樣的操作存在重復性。因...
    jiangmo閱讀 2,882評論 0 11
  • 1. LRU 1.1. 原理LRU(Least recently used,最近最少使用)算法根據數據的歷史訪問記...
    AKyS佐毅閱讀 2,195評論 0 3
  • 自從Apple向開發者開放Xcode 7 Beta版本時,我就下載了Xcode 7 Beta,安裝Xcode 6....
    雷霆嘎巴嘎嘎閱讀 317評論 0 1