今天是『那些讓我們受益一生的經濟學概念』系列的最后一篇文,我們一起來說說博弈論。首先做個健腦操,思考一個有趣的問題:
?有五個海盜,劫了100兩金子要分贓。他們決定通過抓鬮來決定分贓方案:
抓到第一個鬮的人可以先提出一個分配方案,如果方案有一半以上的人同意,就照他的方案分金子,否則第一個人就要被殺掉。余下的人以此類推。
問題來了:如果你是第一個人,你會提出什么方案?
我們假定,每個人都是只追求自己的利益最大化。
我估計有部分讀者會提出平均分配:每人20兩唄,誰還會有異議?又或者采取最安全的保命做法:自己一分不要,你們愛怎么分就怎么分!
但這都并非正確答案哦!請再花個兩三分鐘認真思考一下。
第一個人唯一正確的答案是:100兩金子全部歸我!
而且這個方案一定會被一半以上的人同意,第一個人不會被殺掉。
是不是和直覺有點相悖?那這個答案是怎樣得出的呢?
讓我們用經濟學家的思維來一起解答這道題。
經濟學家最根本的假設是理性人,即每個人都在追求自己的利益最大化。經濟學家最重要的思維之一是邊際考慮,即考慮問題時從最后一個變化單位開始。我們就從最后一個人,即第五個人開始考慮。
輪到第五個人提方案的時候,其他的人都已經死掉了,金子將全部是他的,所以使他利益最大化的行為是,不管前面是誰,提了什么方案,他全部一概否決。
再看第四個人,他知道無論他提什么方案,第五個人都會否決,他都會被殺掉,所以他利益最大化的方案是:盡量不要輪到自己提方案。所以,不管第一個人提了什么方案,他都會同意。
然后看第三個人,知道第四和第五個人的選擇策略后,他的利益最大化的方案是100兩金子全歸自己。因為他知道輪到自己提方案時,只剩下三個人,而自己和第四個人會同意,這樣就超過了一半以上的人同意,行得通。所以不管第一個人提什么方案,第三個人都會反對。
再看第二個人,他明白無論自己提什么方案,第三、和第五個人都會反對,怎樣都無法達到半數以上的人同意,一旦輪到自己提方案,就死定了,所以無論第一個人提什么方案,他利益最大化的行為就是同意。
所以,不管第一個人提什么方案,第二和第四個人都會同意,加上第一個人自己,就是三人同意超過半數,可以通過。既然第一個人提出的任何方案都可以通過,而第一個人追求的是自己利益的最大化,那他的方案就應該是:100兩金子全歸自己。
是不是有點燒腦但很有趣?
這個小故事其實是想告訴大家:在現實中,我們不是在一個毫無干擾的真空世界里做決策,我們的每一個選擇每一步行動都會影響到周圍的其他決策制定者,而他們的選擇也會反過來影響到我們。這就是博弈論討論的主題。
博弈論是著名數學家馮.諾依曼(John von Neumann,1903-1957)開創的,他在20世紀40年代寫了一本書《博弈論與經濟學》,是博弈論的開山之作。
諾依曼的博弈論主要是合作博弈論,即在大家遵守協議的情況下發生的博弈行為。而我們現在說的博弈論主要是非合作博弈論,即相互之間沒有約束力下的博弈行為。非合作博弈論的開創者是我們比較熟悉的美國電影《美麗心靈》(A Beautiful Mind)中的主人公約翰.納什,他獲得了1994年諾貝爾經濟學獎,而他獲獎的主要工作體現在其1950年的博士論文《非合作博弈》中。納什定義了我們經常聽到的納什均衡:這是一種策略組合,使得同一時間內每個參與人的策略是對其他參與人策略的最優反應。
我們常在新聞報道中聽到:大國博弈、企業與消費者的博弈、企業與政府的博弈之類的說法,會不自覺認為博弈是一個離我們很遠且博大精深的概念。其實理解了博弈論的概念,再稍稍多一些觀察,就會發現我們日常的很多決策和行動都涉及到博弈論,掌握博弈論的一些基本原則和方法,能讓我們更加從容智慧地面對人生的各種復雜決策。
用博弈樹幫我們梳理決策思路
有些決策可能很簡單,只需要我們做一次判斷就行。但生活和工作中,我們會遇到一些更復雜的決策問題,涉及多個參與者,多個選擇,以及多次反饋循環,單靠我們在大腦中『暗箱操作』 顯然不夠用,我們需要一些視覺輔助工具來幫助我們分析情況,梳理思路,再做出正確的決策。決策樹和博弈樹就是這樣的工具。
決策樹相信大家都很熟悉,它是利用樹狀圖幫助我們理清思路,分析不同選擇帶來的不同后果。博弈樹也具有同樣的功效,但兩者的區別在于,決策樹適用于一個人面臨各種選擇時的描述分析,而博弈樹則適用于多個參與者在一場策略博弈中的決策次序的描述分析。
我們先看一個決策樹的例子:比如你想從深圳去上海,可以坐汽車、坐火車或者坐飛機,且上述三種交通方式又都包含幾個不同的選擇,這些選擇用決策樹來描述分析的話,是這樣的:
那博弈樹有什么不同呢?博弈樹描述分析的問題性質不同。博弈樹描述分析的是這類問題:
假設在某個地區,洗衣粉市場由一家名為“快潔”的公司獨占,而另一家名為“新潔”的新公司正考慮是否進軍這個市場。若“新潔”決定進入,“快潔”將面臨兩個選擇:一是接納“新潔”,和平共處,但其市場份額會下降;二是打一場價格戰。若“快潔”接納“新潔”,后者可以賺得10萬美元利潤;若“快潔”發動價格戰, “新潔”將遭受20萬美元損失。如若“新潔”決定不進入這個市場,那它的利潤當然為零。而對于“快潔”來說,作為一個壟斷者它可以賺取30萬美元利潤。與“新潔”分享市場后利潤則降為10萬美元,如果發動一場價格戰其代價為10萬美元。
這個復雜的商業博弈情景如果用博弈樹畫出來就會讓人一目了然:
好記性不如爛筆頭,與其挑戰自己大腦的記憶和理解能力,不如在紙上勾勾畫畫。很多時候,我們在腦海中百思不得其解的問題,寫在紙上答案很快會躍然而出。我自己更喜歡用傳統的紙筆寫寫劃劃,這種非常帶感的體驗能幫助我更加清晰深刻地梳理和分析問題。當然手寫的弊端就是速度慢,保存麻煩。習慣了電子化的小伙伴可以用各種思維導圖工具來畫決策樹和博弈樹。
博弈論的經典法則一:向前展望,倒后推理
我們遇到的博弈情境通常分為兩類,第一類是博弈的參與者同時出招,即自己出招時并不知道其他參與者會怎么做。第二類是博弈的參與者相繼出招,即自己出招時必須預計其他參與者接下來的行動。這兩種不同博弈類型的應對策略各有不同。
對于相繼出招的策略博弈來說,總原則是每個參與者必須預計其他參與者接下來的行動,并據此確定自己的最佳招數。這就是博弈論的經典法則一:向前展望,倒后推理。
我們在開篇提到的海盜分金的故事以及洗衣粉品牌新潔和快潔的市場戰,就是這個法則的兩個典型應用場景。遇到相繼出招的博弈,可以畫博弈樹來理清思路,很多情況下,每條選擇路徑都會在有限次的選擇之后到達終點。如果一個博弈無論選擇哪條路徑都會在有限次行動之后到達終點,我們在理論上就可以完全解決這個博弈。這意味著沿著博弈樹倒后推理,我們能找出誰將取勝以及他將怎樣取勝。所以一旦走通了整棵博弈樹,整個博弈問題就會迎刃而解。
博弈論的經典法則二:找到你的優勢策略
對于參與者同時行動的博弈,決策的關鍵是找到自己的優勢策略。我們通過一個例子來具體說明。
為了搶生意,每個星期一兩家相鄰的餐廳山珍餐廳和海味餐廳都會根據時令推出一款新菜式。當山珍餐廳的主廚絞盡腦汁研發新菜式時,他知道海味餐廳的主廚也在做同樣的事。同樣,海味餐廳的主廚研發新菜式時也知道山珍餐廳的主廚正在努力。
這兩家餐廳實際上在進行一場同時行動的博弈 他們都需要在不能提前知曉對方行動方案的情況下做出選擇。也就是說他們只能通過看穿對方的策略才能采取行動。那如何才能看穿對方的策略?也許看穿對方的策略不是那么容易做到,但采取自己的優勢策略卻是可行的。我們具體分析一下:
假設10月的某個星期,鮮甜的大閘蟹和肥美的生蠔上市了,兩家餐廳的主廚需要選擇研發哪一道菜式更能吸引吃貨們進店消費。
我們假設:
1)30%的吃貨對生蠔感興趣;
2)70%的吃貨對大閘蟹感興趣;
3)如果兩家餐廳都用同一種原材料研發新菜式,則吃貨們一半會進山珍餐廳消費,一半會進海味餐廳消費。
現在,山珍餐廳的主廚會進行如下推理:
1)如果海味餐廳采用大閘蟹做新菜,我們采用生蠔做新菜,則我們可以獲得30%的客戶;
2)如果海味餐廳采用大閘蟹做新菜,我們也采用大閘蟹做新菜,則我們可以獲得35%的客戶(70%的一半);
3)如果海味餐廳采用生蠔做新菜,我們采用大閘蟹做新菜,則我們可以獲得70%的客戶;
4)如果海味餐廳采用生蠔做新菜,我們也采用生蠔做新菜,則我們可以獲得15%的客戶。
如果用矩陣來表示上述選擇,會更清晰:
從這個矩陣可以看出,無論海味餐廳的主廚做什么選擇,對山珍餐廳來說,最好的策略都是選擇用大閘蟹做新菜式。這時我們就說山珍餐廳的優勢策略是選擇大閘蟹做新菜式。
所謂優勢策略,就是無論對方如何行動,采取優勢策略帶來的結果一定優于其他任何策略。如果擁有優勢策略,那我們的選擇就十分簡單了:使用優勢策略而不必擔心對手如何行事。
但并不是所有的博弈中每個參與者都有優勢策略,否則任何博弈都會變得很簡單。更加復雜的博弈策略不是我們今天討論的重點。我們只需要掌握基本的博弈法則,如嘗試找找優勢策略,就能提升在日常生活和工作中的決策效率以及決策效果。
博弈論的經典法則三:剔除所有劣勢策略
優勢策略能簡化我們的行動規則,但我們說了并不是所有博弈都有優勢策略。這時,我們可以從優勢策略的對立面來考慮:
博弈論的經典法則三:剔除所有的劣勢策略,不予考慮,如此一步一步做下去。
劣勢策略就是劣于其他任何策略的策略。如果在博弈中你有一個劣勢策略,就應該避免采用,同時你也應該清楚:如果你的對手有一個劣勢策略,他也會避免采用。
剔除劣勢策略的過程如果以一個唯一的結果告終,那就意味著已經找到了博弈的行動策略以及結果。但有時情況不會如此理想,剔除劣勢策略后可能還有多個選擇,但這個過程至少可以縮小博弈的規模,降低博弈的復雜程度。
利用法則二和法則三對博弈進行簡化分析后,博弈的復雜程度會降到最低限度,但同時,我們也有可能會面臨循環推理的問題,即你的最佳策略是以對手的最佳策略為基礎,而反過來從對手方的角度分析也是如此。那怎樣打破這個循環呢?
博弈論的經典法則四:找到均衡
打破上述循環的關鍵就是找到了一個策略組合,在這個組合中,各方的行動就是針對對方行動確定的最佳策略。一旦知道對方在做什么,沒人會更改自己的做法。這就是我們前面提到的『納什均衡』:
所謂納什均衡,指的是參與人的這樣一種策略組合,在該策略組合上,任何參與人單獨改變策略都不會得到好處。換句話說,如果在一個策略組合上,當所有其他人都不改變策略時,沒有人會改變自己的策略,則該策略組合就是一個納什均衡。
納什均衡引出了博弈論的最后一個經典法則:尋找這個博弈的均衡,即一對策略,按照這對策略行事,各個參與者的行動都是對對方行動的最佳回應。
“智豬博弈”是一個著名的納什均衡的例子。
假設豬圈里有一頭大豬、一頭小豬。豬圈很長,一頭有一個踏板,另一頭是飼料的出口和食槽。每踩一下踏板,在遠離踏板的豬圈另一頭的飼料出口就會落下少量食物。如果小豬踩動踏板,大豬會在小豬跑到食槽之前吃光所有的食物;若是大豬踩動踏板,則還有機會在小豬吃完落下的食物之前跑到食槽,爭吃剩下的食物。
這個博弈的均衡策略是什么呢?答案是:小豬選擇“搭便車”策略,舒舒服服等在食槽邊;大豬則為能吃到一點食物不知疲倦地奔忙于踏板和食槽之間。
需要注意的是,雖然我們說博弈的結果是均衡的,但這并不意味著結果就是對博弈參與者的最有利的結果。有利或者不利的評價屬于另一個問題,答案視具體情況而各有不同。
理解并掌握以上關于博弈的五個法則,能讓我們的決策做得更明智。如果小伙伴們對博弈論很感興趣,推薦一本博弈論的經典:《策略思維:商界、政界及日常生活中的策略競爭》,有趣、有益、燒大腦。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ----THE END----
至此,『那些讓我們受益一生的經濟學概念』系列已經全部發布完畢,你有什么收獲嗎?歡迎在留言區和大家一起分享。
『那些讓我們受益一生的經濟學概念』系列文章
本文:那些讓我們受益一生的經濟學概念之:博弈論
【為時未晚】關注個人成長與職業發展。開啟全新的人生旅程,It's never too late.