淺談博弈論和零和游戲

選擇即博弈

博弈論,又稱為對策論,主要研究:

公式化后的激勵結構間的相互關系;(標準規則下,參與者之間的明爭暗斗)

具有斗爭或競爭性質現象的數學理論和方法。


1944年,馮·諾依曼和經濟學家奧斯卡·摩根斯特恩合寫了具有里程碑意義的奠基之作《博弈論與經濟行為》。

將傳統的二人博弈推廣到N人博弈結構,并系統地應用于經濟領域。


博弈,作為一種猜測游戲,蘭德公司(傳奇智庫,世界智囊團開創者)的研究人員,列出了四種基本變體:

“草雞博弈”;“獵鹿博弈”;“僵局”;“囚徒困境”

這四個簡單的游戲在技術文獻中統稱為“社會困境”,但又可以被看作是構造復雜共同進化游戲的四塊積木。

其中“囚徒困境”,由蘭德公司的梅麗爾·弗勒德在1950年設計產生。

游戲中,兩個分別關押的囚犯必須獨立決定坦白還是否認罪行。

如果兩人都認罪,那么兩人都會受到懲罰。如果兩人都否認的話,則都會無罪釋放。假如只有一人認罪,那么認罪者得到獎勵,而另一人受到懲罰。

合作有回報,但如果策略奏效,背叛也有回報。

你是其中一人,會怎么辦呢?

賭對方會不會背叛你

如果只玩一次,背叛對手是最合理的選擇。

但當兩個“囚徒”一次又一次地玩,從中互相學習,即“重復的囚徒困境”,游戲的推演就發生了變化。

你不能無視對手玩家的存在;

不論是作為對手,還是同伙,他都必須受到重視。

這種緊密相連的溝通命運與現實中,政敵之間、生意對手之間的關系非常相似。


隨著對這個簡單游戲的深入研究,問題變成了:

要想在長期內取得高分,面對“重復的囚徒困境”應該采取什么樣的策略?

同無情或者友善的各類玩家對壘時,該采取什么樣額策略更容易取得成功?

最后獲勝的是一個很簡單的對策,“一報還一報”


這種往復型策略,以合作回報合作,以背叛回報背叛,產生了“未來影響”的效果。

這種效果鼓勵合作。

因為對玩家來說,用現在對他人予以的合作來換取今后他人給予的合作是一個合理的選擇。

理論上,游戲的重復次數接近于無限時,納什均衡趨向于帕累托最優。(資源分配的理想狀態,群體利益最大化)

這便是無強制合作的基礎,利他主義的一大原因。

人們追逐個人利益,卻孕育出合作,帶來整體的繁榮。

還有很多博弈論的經典例子。運用在生活中和決策中,可以提供一個有力且獨特的視角。

耶魯公開課:博弈論

http://open.163.com/movie/2007/7/O/B/M6GOEJOME_M7KDCISOB.html



零和博弈

博弈論有四種類型:

合作博弈;非合作博弈;完全信息/不完全信息博弈;靜/動態博弈

其中零和博弈是非合作博弈的典型例子。


參與博弈的各方,在嚴格競爭下,一方的收益必然意味著另一方的損失,博弈各方的收益和損失相加總和永遠為“零”,雙方不存在合作的可能。

也可以說:自己的幸福是建立在他人的痛苦之上的,二者的大小完全相等,因而雙方都想盡一切辦法以實現“損人利己”

零和博弈的結果是一方吃掉另一方,一方的所得正是另一方的所失,整個社會的利益并不會因此而增加一分。

如象棋、賽跑和撲克就是零和游戲:贏家的收益來自于輸家的損失。

與之相對的是非零和博弈,意味著整體的收益可以惠及(有時殃及)所有成員。


人們常用零和游戲的觀點看世界,其實本不該這樣,雙贏是可能的結局。

雙贏是共同進化模式下生命所演繹的故事,是這個網絡和結盟時代里,企業開放合作,通力互惠的優選。

在共同進化的世界里,控制和保密只能幫倒忙。

既然無法控制,那開誠布公比遮遮掩掩效果更好。


在非零和游戲中,你可能將策略公之于眾,這樣一來,所有的玩家就必須適應它。

安卓系統就是技術領域的范例。

騰訊采取開放策略成就企業轉折是企業管理的范例。

分蛋糕還是做大蛋糕

信息公開越發成為趨勢和更優的選擇。

與其爭搶一塊小蛋糕的更多份額,不妨一起把蛋糕做大,這是真正的聰明人的選擇。

在企業內部,則不鼓勵部門內耗,制定一榮俱榮,同甘共苦的策略。

在企業外部,與其拼死爭搶市場份額,不妨結盟,以樹立行業壁壘,防止異軍突起。并在占有率50%以外,尋找其他的市場進行戰略部署,培養新的增長點。

對于個人,學好博弈論,知曉復雜局面下的利害沖突,審慎而行。

靈感來自凱文凱利《失控》

第五章 共同進化

5.5 不講交情或無遠見的合作

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容