本文整理自微信公眾號:紅猴子老師
馬爾可夫鏈 (Markov Chain)它是隨機過程中的一種過程,一個統計模型,到底是哪一種過程呢?好像一兩句話也說不清楚,還是先看個例子吧。
先說說我們村智商為0的王二狗,人傻不拉幾的,見人就傻笑,每天中午12點的標配,仨狀態:吃,玩,睡。這就是傳說中的狀態分布。
你想知道他n天后中午12點的狀態么?是在吃,還是在玩,還是在睡?這些狀態發生的概率分別都是多少? (知道你不想,就假裝想知道吧
先看個假設,他每個狀態的轉移都是有概率的,比如今天玩,明天睡的概率是幾,今天玩,明天也玩的概率是幾幾,還是先看個圖吧,更直觀一些。
有了這個矩陣,再加上已知的第一天的狀態分布,就可以計算出第N天的狀態分布了。
S1 是4月1號中午12點的的狀態分布矩陣 [0.6, 0.2, 0.2],里面的數字分別代表吃的概率,玩的概率,睡的概率。
那么:
4月2號的狀態分布矩陣 S2 = S1 * P (倆矩陣相乘)。
4月3號的狀態分布矩陣 S3 = S2 * P (看見沒,跟S1無關,只跟S2有關)。
4月4號的狀態分布矩陣 S4 = S3 * P (看見沒,跟S1,S2無關,只跟S3有關)。
...
4月n號的狀態分布矩陣 Sn = Sn-1 * P (看見沒,只跟它前面一個狀態Sn-1有關)。
馬爾可夫鏈就是這樣一個任性的過程,它將來的狀態分布只取決于現在,跟過去無關!
就把下面這幅圖想象成是一個馬爾可夫鏈吧。實際就是一個隨機變量隨時間按照馬爾可夫性進行變化的過程。