博弈論就是討論人們在博弈的交互過程中如何決策的學問,不僅僅出現于經濟、管理、政治、生物,也用于社交。每個博弈者在決定采取何種行動時,不但要根據自身的利益和目的行事,還要考慮自身決策行為對他人的可能影響,通過選擇最佳行動計劃,來尋求收益或效用最大化。
《博弈論的統計全集》向人們介紹了二十種博弈模型,小二就簡單地介紹其中幾個自己感興趣的模型給大家。
囚徒困境
話說有一天,一位富翁在家中被殺,財物被盜。警方在此案的偵破過程中,抓到兩個犯罪嫌疑人,并從他們的住處搜出被害人家中丟失的財物。但是,他們矢口否認曾殺過人,辯稱是先發現富翁被殺,然后只是順手牽羊偷了點兒東西。于是警方將兩人隔離審訊。檢察官說:“你們的偷盜罪確鑿,所以可以判你們1年刑期。但是,我可以和你做個交易。如果你單獨坦白殺人的罪行,我只判你3個月的監禁,但你的同伙要被判10年刑。如果你拒不坦白,而被同伙檢舉,那么你就將被判10年刑,他只判3個月的監禁。但是,如果你們兩人都坦白交代,那么,你們都要被判5年刑。”
顯然最好的策略是雙方都抵賴,結果是大家都只被判1年。
這個是博弈論中最經典的入門理論,活路就是彼此信任,懲罰作弊者;比對手跑得快。
智豬博弈
智豬博弈是不同期望值之間的博弈,一方的期望值小于另一方。
籠子里面有兩只豬,一只大,一只小。籠子很長,一頭有一個踏板,另一頭是飼料的出口和食槽。每踩一下踏板,在遠離踏板的豬圈的另一邊的投食口就會落下少量的食物。如果有一只豬去踩踏板,另一只豬就有機會搶先吃到另一邊落下的食物。當小豬踩動踏板時,大豬會在小豬跑到食槽之前剛好吃光所有的食物;若是大豬踩動了踏板,則還有機會在小豬吃完落下的食物之前跑到食槽,爭吃到另一半殘羹。
如果定量地來看,踩一下踏板,將有相當于10個單位的豬食流進食槽,但是踩完踏板之后跑到食槽所需要付出的“勞動”,要消耗相當于2個單位的豬食。
如果兩只豬同時踩踏板,再一起跑到食槽吃,大豬吃到7個單位,小豬吃到3個單位,減去勞動耗費各自2個單位,大豬凈得益5個單位,小豬凈得益1個單位。
如果大豬踩踏板,小豬等著先吃,大豬再趕過去吃,大豬吃到6個單位,去掉踩踏板的勞動耗費2個單位凈得4個單位,小豬也吃到4個單位。
如果小豬踩踏板,大豬等著先吃,大豬吃到9個單位,小豬吃到1個單位,再減去踩踏板的勞動耗費,小豬是凈虧損1個單位。
如果大家都等待,結果是誰都吃不到。矩陣如下:
可以得出結論,唯一解是大豬踩踏板,小豬等待。
按照“重復剔除嚴格劣策略”的邏輯思路,剩下唯一的策略組合,即搭便車,緊跟策略。
搶手博弈:
彼此痛恨的甲、乙、丙三個槍手準備決斗。甲槍法最好,十發八中;乙槍法次之,十發六中;丙槍法最差,十發四中。
先提第一個問題:如果三人同時開槍,并且每人只發一槍;第一輪槍戰后,誰活下來的機會大一些?一般人認為甲的槍法好,活下來的可能性大一些。但合乎推理的結論是,槍法最糟糕的丙活下來的幾率最大。
來分析一下各個槍手的策略。
槍手甲一定要對槍手乙先開槍。因為乙對甲的威脅要比丙對甲的威脅更大,甲應該首先干掉乙,這是甲的最佳策略。同樣的道理,槍手乙的最佳策略是第一槍瞄準甲。乙一旦將甲干掉,乙和丙進行對決,乙勝算的概率自然大很多。槍手丙的最佳策略也是先對甲開槍。乙的槍法畢竟比甲差一些,丙先把甲干掉再與乙進行對決,丙的存活概率還是要高一些。
多人博弈的情況,最后能否勝出,不僅取決于自己的實力,更取決于實力對比關系以及各方的策略:
與強者正面交鋒時,要避其鋒芒;
依據情勢和自身實力,先發或者后發制人;
在沖突的最初階段,等距離外交,誰也不得罪,保存自己的實力;
挑選對手結成同盟;
保持謙遜、低調、圓融平和。
路徑依賴
把五只猴子關在鐵籠里,鐵籠上面放一根香蕉,猴子伸手去拿香蕉,就有人用水槍噴它們,它們手放下去,水也就停了,猴子們都不再去打這根香蕉的主意,這時心理學家把籠子里的一只猴子放出,關進一只新來的猴子,這只新來的猴子看到香蕉就伸手去拿,另外四個知道拿香蕉就會被水噴,然后就把新來的猴子暴揍一頓,新來的猴子認為這根香蕉碰不得,就這樣,學家們依次順序把猴子換掉,到后來,只要有猴子去拿香蕉就被揍,被揍的不知道為什么挨揍,另外四個也不知道為什么要揍它。
在現實生活中,存在著報酬遞增和自我強化的機制。這種機制使人們一旦選擇走上某一路徑,要么進入良性循環的軌道加以優化;要么順著原來的錯誤路徑下滑。給我們的啟示:初始選擇至關重要,多在成功的地方選擇機會。
均衡博弈
在均衡博弈中,一個優勢策略優于任何其他策略;同樣,一個劣勢策略則劣于仍和其他策略。若果你有一個優勢策略,可以采用;嫁入有一個劣勢策略,則要避讓。
1.同時行動時,猜測對方現在在做什么,采取相應的最優策略;
2.相繼行動時,預測其他參與者接下來會有什么反應,據此盤算自己的最優策略。
博弈法則:假如你有一個優勢策略,請照辦,不要考慮你的對手怎么做;假如你沒有一個優勢策略,但你的對手有,假定他會采用這個優勢策略,相應選擇最好的做法。
3.沒有優勢時,提出所有劣勢策略。
以上就是我想分享的內容。