決策和影響同時發生。
在做決策時必須設想如果自己處于其他參與者的位置,會怎樣做決策?這個決策會給自己帶來什么影響
決策樹適用于一個人面臨各種選擇時的描述分析,而博弈樹則適用于多個參與者在一場策略博弈中的決策次序的描述分析。
談判的一個特征在于時間就是金錢,談判的時間拉得越長,蛋糕就會縮水,各方的利益也會受損。
只有一步的情況
此時阿里處于一個非常強勢的地位,他的提議可以使巴巴有所收獲或者一無所獲。即使阿里提出獨享整個蛋糕,巴巴也只能無奈地接受。
兩輪談判的情況
巴巴占優勢,阿里會阻止第二輪談判的發生,所以他會在一開始就提出與巴巴平分蛋糕,這剛好足夠引誘對方接受,也能為自己保證一半的收益。
三輪談判的情況
阿里知道會有這個結果,所以從一開始,他就會許諾分給巴巴1/3的蛋糕(剛好足夠引誘對方接受),而自己得到2/3的蛋糕。
假如談判的輪數是偶數,則阿里應在一開始就提出和巴巴各得一半蛋糕;假如談判的輪數是奇數,阿里應該提議分給巴巴(n-1)/2n,自己得(n+1)/2n。
注意
1妥協的解決方案是很難避免的。當然最后一個提出條件的人可以得到剩下的全部成果,但如果真的走到這一步,大概成 果也所剩無幾了。
2談判的開始就提出一個剛好足夠引誘對方接受的條件。
3在談判開始之前就已經確定了最后結果。因此策略行動的時間可能會提前,在確定談判規則的時候就已經開始了。
4想要成功應用向前展望,倒后推理法則,我們需要明確兩個前提:首先,后行動者可以觀察到先行動者的動作。其次,策略是不可以逆轉的。
博弈是同時進行的,他們都需要在不知道對方行動方案的情況下做出選擇。
比如雜志同時決定上市策略
基于兩個簡單的概念:優勢策略和均衡。
優勢策略
優勢策略“的“優勢“是指你的這個策略(A1)比其他策略(A2、A3)占有優勢,而不是比你對手的策略(B1、B2、B3)更有優勢。無論對方如何行動,采取優勢策略帶來的結果一定比采取任何其他策略帶來的結果好。
法則1:假如你有一個優勢策略,請照辦。
法則2:剔除所有的劣勢策略,不予考慮,如此一步一步做下去。
各方的行動就是針對對方行動確定的最佳策略。一旦知道對手在做什么,沒人會更改自己的做法。博弈論學者把這個結果稱為”均衡”,
法則3:尋找這個博弈的均衡,即一對策略,按照這對策略行事,各個參與者的行動都是對對方行動的最佳回應。
懲罰原則
要想杜絕作弊行為就必須對作弊者進行懲罰。除了一次性的懲罰,還存在另一種懲罰:當博弈反復進行時,這一回合的作弊所得將導致其他回合的損失。
以牙還牙
區別對待的策略
指導原則:
開始合作;
繼續合作;
計算在你合作的情況下對方看上去背叛了多少次;
假如這一百分比變得令人難以接受,就開始使用以牙還牙策略。
事例
第一印象:絕對不能接受第一輪就背叛。轉向以牙還牙策略。
短期:任何3輪當中出現2次背叛也是不能接受的,轉向以牙還牙策略。
中期:過去20輪當中出現3次背叛也是不能接受的,轉向以牙還牙策略。
長期:過去100輪當中出現5次背叛也是不能接受的,轉向以牙還牙策略。
焦土政策
斯大林的焦土政策是策略行動的一個例子。一個策略行動,其設計意圖在于改變對方的看法和行動,使之變得對自己有利,最突出的特征是刻意限制自己的行動自由。
因為你的做法改變了其他參與者對你的行動預期,你可以充分利用這一點,為自己謀利。其他人知道,只要你有行動的自由,你就有讓步的自由。
因為你的做法改變了其他參與者對你的行動預期,你可以充分利用這一點,為自己謀利。其他人知道,只要你有行動的自由,你就有讓步的自由。
分析
這個策略行動的巧妙之處,在于美國單方面、無條件地宣布了自己的選擇,于是展開了有利的形勢。這個選擇不是美國在同時行動的博弈里會做出的選擇。美國如果宣布選擇低投入,得不到任何好處,因為美國不做聲明,日本也會這么預期。要想策略地行動,就不能采取在同時行動博弈里的均衡策略。美國這一出人意料的行動改變了日本的預期,進而改變了日本的選擇。
一旦預期美國選擇高投入,日本就會選擇低投入。當然等日本拿定了主意,美國最好還是改變主意,回到低水平的選擇上,這樣可以為自己獲得4的結果。
換句話說,美國無條件行動的第一步的可信度是關鍵。假如美國并不可信,那么這一招不會有用。為了讓一個策略行動變得可信,就得采取其他的附加行動,讓改變選擇變得代價高昂甚至完全沒有可能。所以,要對這個策略行動做出一個承諾。
總結
一個策略行動包含了兩點:計劃好的行動路線以及使這一路線顯得可信的承諾。
假如你沒有先行,仍然可以通過對一個回應規則做出承諾,然后獲得相仿的策略優勢。這是有條件的策略行動。
回應規則分為兩大類:威脅與許諾。
威脅是對不愿與你合作的人實施懲罰的一種回應規則。
一種是強迫性的威脅,例如恐怖分子劫持飛機,他的回應規則是:假如他的要求不能被滿足,就會炸毀飛機;另一種是阻嚇性的威脅,比如美國威脅說,如果蘇聯出兵攻擊任何一個北約國家,它就會動用核武器回擊。強迫性的威脅意在促使某人采取行動,而阻嚇性的威脅意在阻止某人采取行動。兩種威脅都會有同樣的結局:如果不得不實施威脅,雙方都要大吃苦頭。
許諾是向愿與你合作的人提供回報的方式。
許諾也分為強迫性的和阻嚇性的兩種。強迫性許諾意在促使某人采取對你有利的行動;阻嚇性許諾意在阻止某人采取對你不利的行動 。
所有的威脅與許諾都有一定的回應規則,你不會在沒有回應規則的前提下行動。不過有時候,說明什么事情會在沒有回應規則的情況下發生,仍然有公告天下的作用,這就是警告和保證。
如果實踐一個“威脅”對你有利,就是警告
如果實踐一個“許諾”對你有利,就是保證。
威脅與許諾是真正的策略行動,而警告與保證是起一個告知作用,
你不一定直接建立一個回應規則,相反,你可以故意讓別人利用這些策略當中的一個,例如:
你可以任由別人在你回應前采取一個無條件行動。無條件行動是你先行且行動一成不變(不根據環境變化而改變策略)的回應規則。
你可以等別人發出一個威脅,然后再行動。
你可以等別人提出一個許諾,然后再行動。
原本可以率先行動的一方放棄這一便利,讓對方做出一個無條件的行動,反而可能取得更好的結果。但這不是一個基本規則。有時你可能是想阻止你的對手做出一個無條件的承諾。孫子曾說過:“圍師遺闕”,意思是包圍敵人,要留出口。只要留下出口,敵人就會認定還有機會逃走;而一旦敵人看不到任何逃跑的機會,就會被激發出破釜沉舟的勇氣。
在你許諾時不應讓許諾超過必要的范圍。如果許諾確實影響了對方的行為,你就要準備踐行諾言。這件事做起來應該是代價越小越好,所以許諾只要達到必要的最低限度就行了。同樣的,你不應讓你的威脅超過必要的范圍,
現實與理想有一定的差別,威脅時要選擇大小和可信度。
結論
能奏效的最小而又最恰當的威脅應該成為威脅發出者的首選,一定要讓懲罰與罪行相適應
比如
如果美國想日本多買柑橘和牛肉,應該選一個互惠性質的威脅。比如,美國可以威脅削減日本電器和汽車的進口配額。而不是選擇動用武力
你如果想臨時變化規則 你必須讓別人相信你確實會實踐你的無條件行動、威脅和許諾 ,你的承諾可能會受到檢驗,你必須努力爭取可信度
有八種幫助建立可信度的方法,被稱為“八正道”。這八正道是建立在三個重要原則上的。
第一個原則:改變博弈的結果。也就是說,務必讓遵守你的承諾成為符合你自身利益的選擇:把威脅變成警告,把許諾變成保證。對應的“正道”有:
1.建立和利用一種信譽。
2.寫下合同。
第二個原則:改變博弈,讓你背棄承諾的能力大受限制。對應的”正道”是:
3.切斷溝通。
4.破釜沉舟。
5.讓后果超出你的控制。
違背其中一個小承諾的收益很可能不足以抵消失去余下承諾的損失。因此第六個”正道”是:
6.小步前進
第三個原則:充分利用別人的力量幫助自己遵守承諾。對應的”正道”是:
7.通過團隊合作建立可信度。
8.雇用談判代理人。
舉例
一是通過建立信譽帶來可信度。例如第三次柏林危機。
二是通過破壞信譽為達成一個承諾鋪設道路。
比如
為了保證合同的落實,需要某個具有獨立動機的個人或機構來負責強迫執行承諾或者收取罰金。
(四)破釜沉舟
軍隊常常用斷絕自己后路的做法來達成遵守承諾的目標
所以,破釜沉舟的策略需要指揮者讓自己的士兵們透徹了解,否則就只是作戰室里的異想天開
“奇愛博士
邊緣政策是故意創造一種可以辨認的風險,一種人們不能完全控制的風險。
小步前進
如果把承諾的問題縮小到一個足夠小的范圍,就能解決可信度的問題。你可以將威脅或許諾分解為許多小問題,讓每一個問題都可以單獨解決。
如果大承諾不可行,你可以選一個小的承諾,重復使用。比如裝修分每周付款
團隊合作
這個會員超過200萬的組織里,成員之間通過互相分享經歷、希望和力量,來達到戒酒的目的,幫助自己,也幫助他人。誰如果反悔食言,榮譽和自尊就會付諸東流。
八雇傭談判代理人
打網球的例子
這兩條線的交點——40%,非常關鍵,當A發正手方向球的概率為40%時(40:60的混合策略),B沒法從A的混合策略中占到任何便宜。
不同的選手有不同的絕對優勢和相對優勢,所以上述矩陣里的90%,60%,30%,和20%的概率也會有相應的變化,最佳的混合策略也會不同。
對于發球者A,如果發對方B的正手方向的球,就要觀察對方選擇兩種不同的回應方式會有什么不同的結果。還是上面的圖和例子,當A發正手方向,B對應的差值是90%-30%=60%。當A發反手方向,對應的差值是60%-20%=40%。
將這兩個數字倒過來,就能得到最佳混合策略的比例。
同樣的,對于接球者B來說,當他選擇正手方向去接球,A對應的差為:90%-20%=70%。當B選擇反手方向去接球,對應的差60%-30%=30%。把這兩個數字倒過來,就得到了最佳混合策略比例。所以,接球者B應該按30:70的比例接正手方向和反手方向的球。
接球者B采用自己的最佳混合策略時,發球者A的成功率是48%。發球者A采用自己的最佳混合策略時,接球者的成功率是48%。這不是巧合,而是雙方利益嚴格對立的所有博弈中的共同點。
最小最大定理
在零和博弈里,參與者的利益嚴格相反(一人所得等于另一人所失),每個參與者盡量使對手的最大收益最小化,而他的對手則努力使自己的最小收益最大化。這樣的行動策略會導致一個令人驚訝的結果:最大收益的最小值(最小最大收益)等于最小收益的最大值(最大最小收益)。雙方都無法再改善自己的地位,此時形成了這個博弈的均衡。
適用范圍
剛剛講過的圖表和分析方法能解決所有只有兩個參與者且他們各有兩個策略的零和博弈。但這些方法并不適合非零和博弈,也不適用于參與者數目超過兩個,或者他們擁有的策略數目超過兩個的零和博弈。
運用方法
(一)堅持正確的混合比率
例如,在剛剛說的網球的例子中,當發球者A采用自己的最佳混合策略,按照40∶60的比例發對方正手方向和反手方向的球時,接球者B的成功率為48%。而如果A用其他任何比例,接球者的成功率都會上升。
(二)堅持隨機性
但是,這種有規則的行為很快就會被接球者B識破,B隨即做出正確的策略,因此成功率上升為(4/10)×90%+(6/10)×60%=72%。如果發球者A想取得最好效果,在保證總體混合比例的同時,必須使每一次發球的方向都不可預測。
(三)如何在固定混合比率下隨機行動?
舉個例子,手表上的秒針可以幫助我們獲得任何混合策略比例,發球者A的最佳混合策略是40:60,A可以選擇在秒針落在1~24之間時發B正手方向的球,秒針落在25~60之間時發B反手方向的球