博弈論簡(jiǎn)介
博弈論(Game Theory),也稱對(duì)策論或競(jìng)賽論 。是指研究多個(gè)個(gè)體或團(tuán)隊(duì)之間在特定條件制約下在對(duì)局中利用相關(guān)方的策略,而實(shí)施對(duì)應(yīng)策略的學(xué)科。 它是應(yīng)用數(shù)學(xué)的一個(gè)分支,既是現(xiàn)代數(shù)學(xué)的一個(gè)新分支,也是運(yùn)籌學(xué)的一個(gè)重要學(xué)科。目前在生物學(xué)、經(jīng)濟(jì)學(xué)、國(guó)際關(guān)系學(xué)、計(jì)算機(jī)科學(xué)、政治學(xué)、軍事戰(zhàn)略和其他很多學(xué)科都有廣泛的應(yīng)用。
具有競(jìng)爭(zhēng)或?qū)剐再|(zhì)的行為成為博弈行為。在這類行為中,參加斗爭(zhēng)或競(jìng)爭(zhēng)的各方各自具有不同的目標(biāo)或利益。為了達(dá)到各自的目標(biāo)和利益,各方必須考慮對(duì)手的各種可能的行動(dòng)方案,并力圖選取對(duì)自己最為有利或最為合理的方案。比如日常生活中的下棋,打牌等。博弈論就是研究博弈行為中斗爭(zhēng)各方是否存在著最合理的行為方案,以及如何找到這個(gè)合理的行為方案的數(shù)學(xué)理論和方法。
博弈論分類
1)根據(jù)參與者之間是否具有一個(gè)具有約束力的協(xié)議,博弈可分為合作博弈和非合作博弈。
有:合作博弈(合作中如何分配利益問(wèn)題,使協(xié)議框架內(nèi)所有參與者都滿意)。
沒(méi)有:非合作博弈(如何爭(zhēng)取自己最大化利益,不考慮其它參與者利益)。
2)根據(jù)參與者選擇的策略,做出決定的先后順序,博弈可分為靜態(tài)博弈和動(dòng)態(tài)博弈。
靜態(tài)博弈:參與人同時(shí)選擇策略或者雖非同時(shí)選擇,但后做出決策的行動(dòng)者并不知道先行動(dòng)者采取了什么策略。
動(dòng)態(tài)博弈: 參與人的行動(dòng)有先后順序,且后行動(dòng)者能夠觀察到先行動(dòng)者采取策略的前提下制定自己的策略。
3)根據(jù)對(duì)其它參與者的信息掌握程度,博弈可分為完全信息博弈和不完全信息博弈。
完全信息博弈:每一位參與人對(duì)其他參與人的特征、策略空間及收益函數(shù)(也叫支付)有準(zhǔn)確的信息。
不完全信息博弈:每一位參與人對(duì)其他參與人的特征、策略空間及收益函數(shù)信息了解的不夠準(zhǔn)確、或者不是對(duì)所有參與人的特征、策略空間及收益函數(shù)都有準(zhǔn)確的信息。
博弈論要素
一場(chǎng)博弈包含4個(gè)基本要素:
1.至少兩人參加
2.參與者間的利益(博弈的目的)
3.策略(行動(dòng)方案)
4.信息(制定策略的依據(jù))
博弈模型(常見(jiàn))
囚徒博弈
警方逮捕甲、乙兩名嫌疑犯,但沒(méi)有足夠證據(jù)指控二人入罪。于是警方分開(kāi)囚禁嫌疑犯,分別和二人見(jiàn)面,并向雙方提供以下相同的選擇:若一人認(rèn)罪并作證檢控對(duì)方(相關(guān)術(shù)語(yǔ)稱“背叛”對(duì)方),而對(duì)方保持沉默,此人將即時(shí)獲釋,沉默者將判監(jiān)10年。若二人都保持沉默(相關(guān)術(shù)語(yǔ)稱互相“合作”),則二人同樣判監(jiān)1年。若二人都互相檢舉舉,則二人同樣判監(jiān)8年。
博弈分析:
甲(認(rèn)罪) | 甲(沉默) | |
乙(認(rèn)罪) | 8,8 | 0,10 |
乙(沉默) | 10,0 | 1,1 |
囚徒困境假定每個(gè)參與者(即“囚徒”)都是利己的,即都尋求最大自身利益,而不關(guān)心另一參與者的利益。這場(chǎng)博弈的納什均衡,顯然不是顧及團(tuán)體利益的帕累托最優(yōu)解決方案。以全體利益而言,如果兩個(gè)參與者合作保持沉默,兩人都只會(huì)被判刑1年,總體利益更高,結(jié)果也比兩人背叛對(duì)方、判刑8年的情況較佳。但根據(jù)以上假設(shè),二人均為理性的個(gè)人,且只追求自己個(gè)人利益。均衡狀況會(huì)是兩個(gè)囚徒都選擇背叛,結(jié)果二人判決均比合作要高,總體利益較合作低。這就是“困境”所在。例子漂亮地證明了:非零和博弈中,帕累托最優(yōu)和納什均衡是相沖突的。
智豬博弈
假設(shè)豬圈里有兩頭豬,一頭大豬,一頭小豬。 豬圈很長(zhǎng),一頭有一踏板,另一頭是飼料的出口和食槽。豬每踩一下踏板,另一邊就會(huì)有相當(dāng)于10份的豬食進(jìn)槽,但是踩踏板以后跑到食槽所需要付出的“勞動(dòng)”,加起來(lái)要消耗相當(dāng)于2份的豬食。踏板和食槽分置籠子的兩端,如果有一只豬去踩踏板,另一只豬就有機(jī)會(huì)搶先吃到另一邊落下的食物。
博弈分析:
如果兩只豬同時(shí)踩踏板,同時(shí)跑向食槽,大豬吃進(jìn)7份,得益5份,小豬吃進(jìn)3份,實(shí)得1份;如果大豬踩踏板后跑向食槽,這時(shí)小豬搶先,吃進(jìn)4份,實(shí)得4份,大豬吃進(jìn)6份,付出2份,得益4份;如果大豬等待,小豬踩踏板,大豬先吃,吃進(jìn)9份,得益9份,小豬吃進(jìn)1份,但是付出了2份,實(shí)得-1份;如果雙方都懶得動(dòng),所得都是0。
踩踏板消耗2份食物 | 大豬(踩踏板) | 大豬(等待) |
小豬(踩踏板) | 1,5 | -1,7 |
小豬(等待) | 4,4 | 0,0 |
利益分配格局決定兩頭豬的理性選擇:小豬踩踏板只能吃到一份,不踩踏板反而能吃上4份。對(duì)小豬而言,無(wú)論大豬是否踩動(dòng)踏板,小豬將選擇“搭便車”策略,也就是舒舒服服地等在食槽邊,這是最好的選擇。
啟發(fā):
(商戰(zhàn))大企業(yè)與小企業(yè):小企業(yè)(小豬)將行業(yè)老大(大豬)的實(shí)力轉(zhuǎn)化為自己的助力。
(股市)大戶與散戶:大戶設(shè)局形成豬圈,引小戶(小豬)入套....。
(獎(jiǎng)懲)企業(yè)與員工:杜絕智豬博弈(搭便車現(xiàn)象),(移動(dòng)食物槽位并減少食物投放)。
(董事會(huì))大股東與小股東:大股東為企業(yè)的盈利虧損負(fù)責(zé),小股東不負(fù)責(zé)監(jiān)管直接拿分紅。
總結(jié):
無(wú)論是商業(yè)中的"抱大腿",還是人生奮斗歷程中的搭"搭便車"都是一種策略,一次機(jī)會(huì)。只要我們以一種平實(shí)的心態(tài)就能以這種快捷的方式獲得成功。
獵鹿博弈
源自啟蒙思想家盧梭的著作《論人類不平等的起源和基礎(chǔ)》
古代的村莊有兩個(gè)獵人。當(dāng)?shù)氐墨C物主要有兩種:鹿和兔子。如果一個(gè)獵人單兵優(yōu)作戰(zhàn),一天最多只能打到4只兔子。只有兩個(gè)一起去才能獵獲一只鹿。從填飽肚子的角度來(lái)說(shuō),4只兔子能保證一個(gè)人4天不挨餓,而一只鹿卻能讓兩個(gè)人吃上10天。
博弈分析:
兩個(gè)人的行為決策可以形成兩個(gè)博弈結(jié)局:分別打兔子,每人得4;合作,每人得10。這樣獵鹿博弈有兩個(gè)納什均衡點(diǎn),那就是:要么分別打兔子,每人吃飽4天;要么合作,每人吃飽10天。
獵人A(獵兔) | 獵人A(獵鹿) | |
獵人B(獵兔) | 4,4 | 4,0 |
獵人B(獵鹿) | 0,4 | 10,10 |
獵鹿博弈反應(yīng)的是:合作帶來(lái)的最大利益。
槍手博弈
該模型可以簡(jiǎn)單概括為:實(shí)力越強(qiáng)死得越快。最能體現(xiàn)這個(gè)博弈的:赤壁之戰(zhàn)。
甲乙丙三個(gè)槍手準(zhǔn)備決斗。甲槍法最好,80%命中率。乙槍法次之,60%命中率。丙槍法最差,40%命中率。假設(shè)他們了解彼此實(shí)力,也能做出理性判斷。問(wèn)題一:如果三人同時(shí)開(kāi)槍,并且每人只發(fā)一槍。第一輪槍戰(zhàn)后,誰(shuí)活下來(lái)的機(jī)會(huì)大?問(wèn)題二:如果三人輪流開(kāi)槍,并且由槍法最差的丙先開(kāi)槍,他該怎么做?
博弈分析:
問(wèn)題一:同時(shí)開(kāi)槍
甲的最佳策略:先瞄準(zhǔn)乙。因?yàn)橐覍?duì)甲的威脅要比丙大,所以應(yīng)該首先干掉乙,再干掉丙小菜一碟。
乙的最佳策略:先瞄準(zhǔn)甲。一旦將甲干掉了,和丙進(jìn)行對(duì)決,乙勝算的概率要大得多。
丙的最佳策略:也是先瞄準(zhǔn)甲。畢竟對(duì)丙來(lái)說(shuō),乙的威脅還是比甲要小一些,先努力干掉甲再想如何面對(duì)乙,這是丙的正常思路。
在這種情況下,我們計(jì)算一下三個(gè)槍手開(kāi)槍后各自存活的概率:
甲存活概率:40%X60%=24%。
乙存貨概率:20%
丙存貨概率:100%
問(wèn)題二:輪流開(kāi)槍
甲先開(kāi)槍:必定把槍口對(duì)準(zhǔn)乙,
乙被打死,接下來(lái)由丙開(kāi)槍。丙會(huì)對(duì)甲開(kāi)槍,甲存活率為60%,丙存活率100%。
乙未被打死,接下來(lái)由乙開(kāi)槍,乙會(huì)對(duì)甲開(kāi)槍,無(wú)論甲是否被乙殺死,接下來(lái)開(kāi)槍的是丙,其存活率100%。
乙先開(kāi)槍:和第一種情況一致,丙的存活率依然最高。
丙先開(kāi)槍:根據(jù)情況適當(dāng)調(diào)整策略,隨便開(kāi)一空搶,接下來(lái)由甲開(kāi)槍,甲會(huì)對(duì)乙開(kāi)槍,丙的存活率仍然最高。向甲開(kāi)槍時(shí)一種冒險(xiǎn)的行為,因?yàn)槿f(wàn)一殺死了甲,乙就會(huì)向丙開(kāi)槍,此時(shí)丙的存活率為40%。
在現(xiàn)實(shí)中,會(huì)有信息不對(duì)稱的情況。比如如果槍手甲偽裝自己,讓乙和丙認(rèn)為他的槍法最差:這時(shí),幸存者是甲的概率就會(huì)大幅上升。在現(xiàn)實(shí)中,能力很強(qiáng)的人要學(xué)會(huì)韜光養(yǎng)晦,往往能成為最后的勝利者。 能力差的人在競(jìng)爭(zhēng)中耍弄手腕能贏一時(shí),但往往不能最終成事;提升自己實(shí)力會(huì)在最后的對(duì)決中起到關(guān)鍵作用。 無(wú)論是一次性博弈還是相繼出招的序慣博弈,博弈者都要努力尋找自己最有力的策略。
如果自身沒(méi)有優(yōu)勢(shì)策略,那就站在對(duì)方的角度上進(jìn)行分析,確定對(duì)方的最優(yōu)策略。得到的最終結(jié)果都不會(huì)超過(guò)最優(yōu)勢(shì)策略得到的結(jié)果,可大膽放心使用。
如果身處復(fù)雜的博弈當(dāng)中,一時(shí)間無(wú)法確定自己的最佳策略,就先選擇把自己的劣勢(shì)策略排除,來(lái)簡(jiǎn)化博弈情況。
警察與小偷博弈
在一個(gè)小鎮(zhèn)上,只有一名警察負(fù)責(zé)巡邏,保衛(wèi)小鎮(zhèn)的人生和財(cái)產(chǎn)安全。小鎮(zhèn)分A,B兩區(qū),A區(qū)一酒館,B區(qū)一倉(cāng)庫(kù),鎮(zhèn)上還僅住著一名小偷,他的目標(biāo)時(shí)A區(qū)酒館或者B區(qū)倉(cāng)庫(kù)。因?yàn)橹挥幸幻欤看沃荒苓x擇A區(qū)或B區(qū)一個(gè)區(qū)域區(qū)巡邏,而小偷正是看到這一點(diǎn),每次也到一個(gè)區(qū)域區(qū)偷竊。假設(shè)A區(qū)有2萬(wàn)元財(cái)產(chǎn),B區(qū)有1萬(wàn)元財(cái)產(chǎn)。警察區(qū)A區(qū)巡邏,小偷去B區(qū),則B區(qū)1萬(wàn)元財(cái)產(chǎn)歸小偷;如果警察去B區(qū)巡邏,小偷也去A區(qū),則被逮捕。警察去B區(qū)巡邏,小偷去A區(qū),則2A區(qū)2萬(wàn)元財(cái)產(chǎn)歸小偷,;如果警察去B區(qū)巡邏,小偷也去B區(qū),則同樣被逮捕。那警察采取那種方式巡邏,鎮(zhèn)上的財(cái)產(chǎn)損失最少?
分析:
警察(A區(qū)) | 警察(B區(qū)) | |
小偷(A區(qū)) | 0,3 | 2,1 |
小偷(B區(qū)) | 1,2 | 0,3 |
警察抽簽的方式(2個(gè)A區(qū)簽,1個(gè)B區(qū)簽),去A區(qū)巡邏的概率2/3,去B去巡邏的概率1/3。
小偷抽簽的方式(2個(gè)A區(qū)簽,1個(gè)B區(qū)簽),抽到A區(qū)簽去B區(qū)巡邏,抽到B區(qū)簽去A區(qū)巡邏。
斗雞博弈
試想有兩只好斗的公雞狹路相逢,每只雞有兩個(gè)行動(dòng)選擇:一是退下來(lái),一是進(jìn)攻。如果一方退下來(lái),而對(duì)方?jīng)]有退下來(lái),對(duì)方獲得勝利;如果對(duì)方也退下來(lái),雙方則打個(gè)平手;如果自己沒(méi)退下來(lái),而對(duì)方退下來(lái),自己則勝利,對(duì)方則失敗;如果兩只雞都前進(jìn),那么則兩敗俱傷。因此,對(duì)兩只雞來(lái)說(shuō),最好的結(jié)果是,對(duì)方退下來(lái),而自己不退。
A雞(前進(jìn)) | A雞(后退) | |
B雞(前進(jìn)) | -2,-2 | 1,-1 |
B雞(后退) | -1,1 | -1,-1 |
這個(gè)博弈有兩個(gè)純策略納什均衡:一方前進(jìn),另一方后退;或一方后退,另一方前進(jìn)。但關(guān)鍵是誰(shuí)進(jìn)誰(shuí)退?當(dāng)然,該博弈也存在一個(gè)混合策略均衡,即大家隨機(jī)的選擇前進(jìn)或后退。不過(guò)相對(duì)而言,我們更關(guān)注于純策略均衡。一博弈,如果有惟一的納什均衡點(diǎn),那么這個(gè)博弈是可預(yù)測(cè)的,即這個(gè)納什均衡點(diǎn)就是事先知道的惟一的博弈結(jié)果。但是如果一博弈有多個(gè)納什均衡,則要預(yù)測(cè)結(jié)果就必須附加另外的有關(guān)博弈的細(xì)節(jié)信息。比如,這里誰(shuí)進(jìn)誰(shuí)退,可能就需要附加額外的細(xì)節(jié)信息才能做出判斷。
斗雞博弈強(qiáng)調(diào)的是,如何在博弈中采用妥協(xié)的方式取得利益。如果雙方都換位思考,它們可以就補(bǔ)償進(jìn)行談判,最后造成以補(bǔ)償換退讓的協(xié)議,問(wèn)題就解決了。博弈中經(jīng)常有妥協(xié),雙方能換位思考就可以較容易地達(dá)成協(xié)議。考慮自己得到多少補(bǔ)償才愿意退,并用自己的想法來(lái)理解對(duì)方。只從自己立場(chǎng)出發(fā)考慮問(wèn)題,不愿退,又不想給對(duì)方一定的補(bǔ)償,僵局就難以打破。
協(xié)和博弈
協(xié)和謬誤即某件事情在投入了一定成本、進(jìn)行到一定程度而后發(fā)現(xiàn)不宜繼續(xù)下去,卻苦于各種原因而將錯(cuò)就錯(cuò),欲罷不能。
當(dāng)你進(jìn)行了一項(xiàng)不理性的行動(dòng)后,應(yīng)該忘記已經(jīng)發(fā)生的行為和你支付的成本,只要考慮這項(xiàng)活動(dòng)之后需要耗費(fèi)的精力和能夠帶來(lái)的好處,再綜合評(píng)定它能否給自己帶來(lái)正效用。比如進(jìn)行投資時(shí),把目光投向前方,審時(shí)度勢(shì),如果發(fā)現(xiàn)這項(xiàng)投資并不能贏利,應(yīng)該及早停掉,不要惋惜已投下去的各項(xiàng)成本:精力、時(shí)間、金錢……
海盜分金博弈
5個(gè)海盜搶得100枚金幣,他們按抽簽的順序依次提方案:首先由1號(hào)提出分配方案,然后5人表決,超過(guò)半數(shù)同意方案才被通過(guò),否則他將被扔入大海喂鯊魚(yú),依此類推。 這是一個(gè)高度簡(jiǎn)化和抽象的模型,體現(xiàn)了博弈的思想。 假定“每人海盜都是絕頂聰明且很理智”,那么“第一個(gè)海盜提出怎樣的分配方案才能夠使自己的收益最大化?”
博弈分析:
推理過(guò)程采用倒推的方式:
從后向前推,在只剩4號(hào)和5號(hào)的話,4號(hào)的方案一定是100,0,此時(shí)即使5號(hào)反對(duì)結(jié)果也無(wú)法反對(duì)。
在只剩3號(hào)4號(hào)和5號(hào)的話,根據(jù)5號(hào)之前的處境,3號(hào)會(huì)提出99,0,1的方案,該方案3號(hào)一定同意,4號(hào)肯定不同意,但5號(hào)一定回頭贊成票。如果5號(hào)投了反對(duì)票,就會(huì)回到只剩4號(hào)和5號(hào)的情況。
在2號(hào)3號(hào)4號(hào)和5號(hào)共存的情況下,2號(hào)最好的分配方案是98,0,0,2,既籠絡(luò)5號(hào),放棄3號(hào)4號(hào),2號(hào)和5號(hào)投贊成票,3號(hào)4號(hào)投反對(duì)票,方案半數(shù)人同意而通過(guò)。
那1至5號(hào)都在的情況下,假如1號(hào)海盜被扔進(jìn)大海,由2號(hào)海盜來(lái)分配方案的話,3號(hào)和4號(hào)海盜什么也得不到,因此1號(hào)海盜的分配方案就會(huì)從處于劣勢(shì)的3號(hào)和4號(hào)海盜入手,最優(yōu)方案是98,0,1,1,0,這樣1號(hào)3號(hào)4號(hào)投贊成票,2和5號(hào)投反對(duì)票,方案通過(guò)。
模型任意改變一個(gè)假設(shè)條件,最終結(jié)果都會(huì)不一樣。
海盜分金是一個(gè)高度簡(jiǎn)化和抽象的模型,體現(xiàn)了博弈的思想。在“海盜分金”模型中,任何“分配者”想讓自己的方案獲得通過(guò)的關(guān)鍵是事先考慮清楚“挑戰(zhàn)者”的分配方案是什么,并用最小的代價(jià)獲取最大收益,拉攏“挑戰(zhàn)者”分配方案中最不得意的人們。企業(yè)中的一把手,在進(jìn)行內(nèi)部人員控制時(shí),經(jīng)常是拋開(kāi)二號(hào)人物,而與會(huì)計(jì)和出納們打得火熱,就是因?yàn)楣纠锏男∪宋锖檬召I。 1號(hào)看起來(lái)最有可能喂鯊魚(yú),但他牢牢地把握住先發(fā)優(yōu)勢(shì),結(jié)果不但消除了死亡威脅,還收益最大。這不正是全球化過(guò)程中先進(jìn)國(guó)家的先發(fā)優(yōu)勢(shì)嗎?而5號(hào),看起來(lái)最安全,沒(méi)有死亡的威脅,甚至還能坐收漁人之利,卻因不得不看別人臉色行事而只能分得一小杯羹。
路徑依賴博弈
一旦人們做了某種選擇,就好比走上了一條不歸之路,慣性的力量會(huì)使這一選擇不斷自我強(qiáng)化,并讓你不能輕易走出去。
美國(guó)經(jīng)濟(jì)學(xué)家道格拉斯·諾思是第一個(gè)提出制度的“路徑依賴”理論的學(xué)者,他認(rèn)為,路徑依賴類似于物理學(xué)中的“慣性”,一旦進(jìn)入某一路徑(無(wú)論是“好”的還是“壞”的)就可能對(duì)這種路徑產(chǎn)生依賴。某一路徑的既定方向會(huì)在以后發(fā)展中得到自我強(qiáng)化。人們過(guò)去做出的選擇決定了他們現(xiàn)在及未來(lái)可能的選擇。好的路徑會(huì)對(duì)企業(yè)起到正反饋的作用,通過(guò)慣性和沖力,產(chǎn)生飛輪效應(yīng),企業(yè)發(fā)展因而進(jìn)入良性循環(huán);不好的路徑會(huì)對(duì)企業(yè)起到負(fù)反饋的作用,就如厄運(yùn)循環(huán),企業(yè)可能會(huì)被鎖定在某種無(wú)效率的狀態(tài)下而導(dǎo)致停滯。而這些選擇一旦進(jìn)入鎖定狀態(tài),想要脫身就會(huì)變得十分困難。
在現(xiàn)實(shí)生活中,路徑依賴現(xiàn)象無(wú)處不在。一個(gè)著名的例子是:現(xiàn)代鐵路兩條鐵軌之間的標(biāo)準(zhǔn)距離是四英尺又八點(diǎn)五英寸,為什么采用這個(gè)標(biāo)準(zhǔn)呢?原來(lái),早期的鐵路是由建電車的人所設(shè)計(jì)的,而四英尺又八點(diǎn)五英寸正是電車所用的輪距標(biāo)準(zhǔn)。那么,電車的標(biāo)準(zhǔn)又是從哪里來(lái)的呢?最先造電車的人以前是造馬車的,所以電車的標(biāo)準(zhǔn)是沿用馬車的輪距標(biāo)準(zhǔn)。馬車又為什么要用這個(gè)輪距標(biāo)準(zhǔn)呢?因?yàn)楣帕_馬人軍隊(duì)?wèi)?zhàn)車的寬度就是四英尺又八點(diǎn)五英寸。羅馬人為什么以四英尺又八點(diǎn)五英寸為戰(zhàn)車的輪距寬度呢?原因很簡(jiǎn)單,這是牽引一輛戰(zhàn)車的兩匹馬屁股的寬度。
有趣的是,美國(guó)航天飛機(jī)燃料箱的兩旁有兩個(gè)火箭推進(jìn)器,因?yàn)檫@些推進(jìn)器造好之后要用火車運(yùn)送,路上又要通過(guò)一些隧道,而這些隧道的寬度只比火車軌道寬一點(diǎn),因此火箭助推器的寬度由鐵軌的寬度所決定。所以,今天世界上最先進(jìn)的運(yùn)輸系統(tǒng)的設(shè)計(jì),在兩千年前便由兩匹馬的屁股寬度決定了!
名詞解釋
納什均衡
納什均衡,又稱為非合作博弈均衡,是博弈論的一個(gè)重要術(shù)語(yǔ),以約翰·納什命名。在一個(gè)博弈過(guò)程中,無(wú)論對(duì)方的策略選擇如何,當(dāng)事人一方都會(huì)選擇某個(gè)確定的策略,則該策略被稱作支配性策略。如果兩個(gè)博弈的當(dāng)事人的策略組合分別構(gòu)成各自的支配性策略,那么這個(gè)組合就被定義為納什均衡。一個(gè)策略組合被稱為納什均衡,當(dāng)每個(gè)博弈者的均衡策略都是為了達(dá)到自己期望收益的最大值,與此同時(shí),其他所有博弈者也遵循這樣的策略。
納什均衡的重要影響:
1.改變了經(jīng)濟(jì)學(xué)的體系和結(jié)構(gòu)。
2.擴(kuò)展了經(jīng)濟(jì)學(xué)研究經(jīng)濟(jì)問(wèn)題的范圍。
3.加強(qiáng)了經(jīng)濟(jì)學(xué)研究的深度。
4.形成了基于經(jīng)典博弈的研究范式體系。
5.擴(kuò)大和加強(qiáng)了經(jīng)濟(jì)學(xué)與其他社會(huì)科學(xué)、自然科學(xué)的聯(lián)系。
帕累托效率
帕累托最優(yōu)(Pareto Optimality),也稱為帕累托效率、帕累托改善,是博弈論中的重要概念,并且在經(jīng)濟(jì)學(xué), 工程學(xué)和社會(huì)科學(xué)中有著廣泛的應(yīng)用。
帕累托最優(yōu)是指資源分配的一種理想狀態(tài),假定固有的一群人和可分配的資源,從一種分配狀態(tài)到另一種狀態(tài)的變化中,在沒(méi)有使任何人境況變壞的前提下,使得至少一個(gè)人變得更好,這就是帕累托改進(jìn)或帕累托最優(yōu)化。帕累托最優(yōu)的狀態(tài)就是不可能在有更過(guò)的帕累托改進(jìn)的余地;換句話說(shuō),帕累托改進(jìn)是達(dá)到帕累托最優(yōu)的路徑和方法。帕累托最優(yōu)是公平與效率的“理想王國(guó)”。
一般來(lái)說(shuō),達(dá)到帕累托最優(yōu)時(shí),會(huì)同時(shí)滿足以下3個(gè)條件:
交換最優(yōu):即使再交易,個(gè)人也不能從中得到更大的利益。此時(shí)對(duì)任意兩個(gè)消費(fèi)者,任意兩種商品的邊際替代率是相同的,且兩個(gè)消費(fèi)者的效用同時(shí)得到最大化。
生產(chǎn)最優(yōu):這個(gè)經(jīng)濟(jì)體必須在自己的生產(chǎn)可能性邊界上。此時(shí)對(duì)任意兩個(gè)生產(chǎn)不同產(chǎn)品的生產(chǎn)者,需要投入的兩種生產(chǎn)要素的邊際技術(shù)替代率是相同的,且兩個(gè)消費(fèi)者的產(chǎn)量同時(shí)得到最大化。
產(chǎn)品混合最優(yōu):經(jīng)濟(jì)體產(chǎn)出產(chǎn)品的組合必須反映消費(fèi)者的偏好。此時(shí)任意兩種商品之間的邊際替代率必須與任何生產(chǎn)者在這兩種商品之間的邊際產(chǎn)品轉(zhuǎn)換率相同。
如果一個(gè)經(jīng)濟(jì)體不是帕累托最優(yōu),則存在一些人可以在不使其他人的境況變壞的情況下使自己的境況變好的情形。普遍認(rèn)為這樣低效的產(chǎn)出的情況是需要避免的,因此帕累托最優(yōu)是評(píng)價(jià)一個(gè)經(jīng)濟(jì)體和政治方針的非常重要的標(biāo)準(zhǔn)。
夏普里值方法
夏普利值指所得與自己的貢獻(xiàn)相等,是一種分配方式。核心是付出和收益成正比。
考慮這樣一個(gè)聯(lián)盟博弈。有這樣一個(gè)三人財(cái)產(chǎn)分配問(wèn)題。假定財(cái)產(chǎn)為100萬(wàn)元,假定這100萬(wàn)元在三個(gè)人之間進(jìn)行分配。A擁有50%的票力,b擁有40%的票力,c擁有10%的票力。規(guī)則規(guī)定,當(dāng)超過(guò)50%的票認(rèn)可了某種方案時(shí),才能獲得整個(gè)財(cái)產(chǎn),否則三人將一無(wú)所獲。
我們看到,任何單獨(dú)一個(gè)人的票力都不超過(guò)50%,從而不能單獨(dú)決定財(cái)產(chǎn)的分配。要超過(guò)50%的票力必須要形成聯(lián)盟。也就是說(shuō),在這個(gè)例子中任何人的權(quán)利都不是“決定性的”,也沒(méi)有一個(gè)人是“無(wú)權(quán)利的”或權(quán)利為0.
此時(shí)財(cái)產(chǎn)應(yīng)當(dāng)按票力分配嗎?如果是的話,即a、b、c的財(cái)產(chǎn)分配為:50%,40%,10%。但如果這樣分配的話,c可以提出這樣的方案,a:70%,b:0,c:30%。這個(gè)方案能被a、c接受,因?yàn)閷?duì)a、c來(lái)說(shuō)這是一個(gè)比按票力分配有明顯改進(jìn)的方案,盡管b被排除出去,但是a、c的票力構(gòu)成大多數(shù)(60%)。
在這樣的情況下,b會(huì)向a提出這樣一個(gè)方案,a:80%,b20%,c:0。此時(shí)a和b所得均比剛才c提出的方案要好,但c成了一無(wú)所有,但a、b票力綜合構(gòu)成多數(shù)(90%)……這樣的過(guò)程可以一直進(jìn)行下去。
在這個(gè)過(guò)程中,理性的人會(huì)形成聯(lián)盟ab、ac或abc。但哪個(gè)聯(lián)盟能夠形成呢?最終的分配結(jié)果應(yīng)該是怎樣的呢?
夏普里值是這樣的一個(gè)值:在各種可能的聯(lián)盟次序下,參與者對(duì)聯(lián)盟的邊際貢獻(xiàn)之和除以各種可能的聯(lián)盟組合。在財(cái)產(chǎn)分配問(wèn)題上,我們可以寫出各種可能的聯(lián)盟順序。而邊際貢獻(xiàn)就在于在這個(gè)順序中誰(shuí)是這個(gè)聯(lián)盟的“關(guān)鍵加入者”。如果是關(guān)鍵加入者,那么他的邊際貢獻(xiàn)就為100萬(wàn)元。下表:財(cái)產(chǎn)問(wèn)題中各種排列下的關(guān)鍵加入者:
次序 | abc | acb | bac | bca | cab | cba |
關(guān)鍵加入者 | b | c | a | a | a | a |
由上表,我們得到abc的夏普里值分別為: A=4/6,b=1/6,c=1/6
從這個(gè)例子可以看到,票力是虛假的實(shí)力表示。b、c票里不同,但是夏普里值相同,即權(quán)利相同,他們?cè)谛纬色@勝聯(lián)盟中作為關(guān)鍵加入者的課程性是一樣的。
哈丁悲劇
公共資源悲劇最初由哈定提出。哈定舉了這樣一個(gè)具體事例:一群牧民面對(duì)向他們開(kāi)放的草地,每一個(gè)牧民都想多養(yǎng)一頭牛,因?yàn)槎囵B(yǎng)一頭牛增加的收益大于其購(gòu)養(yǎng)成本,是合算的,盡管因平均草量下降,可能使整個(gè)牧區(qū)的牛的單位收益下降。每個(gè)牧民都可能多增加一頭牛,草地將可能被過(guò)度放牧,從而不能滿足牛的食量,致使所有牧民的牛均餓死。這就是公共資源的悲劇。
“公地悲劇”展現(xiàn)的是一幅私人利用免費(fèi)午餐時(shí)的狼狽景象——無(wú)休止地掠奪。“悲劇”的意義就在于此。根據(jù)哈丁的討論,結(jié)合我們對(duì)掙扎在生活磨難中的人們的理解,“公地悲劇”的發(fā)生機(jī)理似乎可以這樣來(lái)理解:勤勞的人為個(gè)人的生計(jì)而算計(jì),在一番忽視遠(yuǎn)期利益的計(jì)算后,開(kāi)始為眼前利益而“殺雞取卵”,沒(méi)有規(guī)則,沒(méi)有產(chǎn)權(quán)制度,沒(méi)有強(qiáng)制,最后,導(dǎo)致公共財(cái)產(chǎn)——那個(gè)人們賴依生存的搖籃的崩潰,公地悲劇”的更準(zhǔn)確的提法是:無(wú)節(jié)制的、開(kāi)放式的、資源利用的災(zāi)難。
應(yīng)對(duì)之策:
1、明確和穩(wěn)定產(chǎn)權(quán)。
2、配合企業(yè)制度改革,力爭(zhēng)做到公共產(chǎn)品私人供給。
3、加強(qiáng)制度建設(shè),重視委托、代理、搭便車、機(jī)會(huì)主義問(wèn)題研究。
最小最大策略
在二人零和博弈中,參與者的利益嚴(yán)格相反(一人所得等于另一人所失),每個(gè)參與者都會(huì)盡最大努力使對(duì)手的最大收益最小化,而他的對(duì)手則正好相反,他們努力使自己的最小收益最大化。
鱷魚(yú)法則
假定一只鱷魚(yú)咬住你的腳,如果你用手去試圖掙脫你的腳,鱷魚(yú)便會(huì)同時(shí)咬住你的腳與手。你愈掙扎,就被咬住得越多。所以,萬(wàn)一鱷魚(yú)咬住你的腳,你唯一的機(jī)會(huì)就是犧牲一只腳。
給人的啟示:當(dāng)發(fā)現(xiàn)自己的行動(dòng)已經(jīng)離既定方向越來(lái)越遠(yuǎn)時(shí),果斷做出選擇,停止行動(dòng),不要有一絲僥幸心理。
蔡格尼效應(yīng)
是指人們天生有一種辦事有始有終的驅(qū)動(dòng)力,人們之所以會(huì)忘記已完成的工作,是因?yàn)橛瓿傻膭?dòng)機(jī)已經(jīng)得到滿足;如果工作尚未完成,這同一動(dòng)機(jī)便使他對(duì)此留下深刻印象。 一般來(lái)說(shuō),工作難度越大,思維越活躍,短時(shí)間強(qiáng)化的強(qiáng)度就越高,而強(qiáng)化對(duì)增強(qiáng)記憶是有益的。因此,被中止的工作往往容易被首先回憶。此外,工作難度大時(shí),人們的情緒變化也大,而情緒對(duì)回憶是有很大的幫助。
避免措施:
第一,在看事物的時(shí)候運(yùn)用自己的價(jià)值觀標(biāo)準(zhǔn),如果發(fā)現(xiàn)一個(gè)工作計(jì)劃不值得做,那么就勇敢地放棄。
第二,編制一個(gè)時(shí)間表,把必須做的事以及要費(fèi)的時(shí)間都寫下來(lái)。努力培養(yǎng)出一種較合實(shí)際的意識(shí),把期限定在要求辦妥的時(shí)間以前。如果有筆帳必須在12月1日繳付,那就預(yù)訂在11月25日付出。
第三,一點(diǎn)一滴地強(qiáng)化意志力,我們可以先從一件小事來(lái)訓(xùn)練自己,比如強(qiáng)迫自己在洗碗槽里留下幾只碟子不洗,看一本書(shū)的時(shí)候,嘗試停一下,想想自己是否在浪費(fèi)時(shí)間和精力,如果是的,要不要繼續(xù)看下去?
第四,從現(xiàn)在開(kāi)始:做任何事情,不要想著我還有時(shí)間去做,等待片刻;這樣子會(huì)讓大腦產(chǎn)生一定的滯后性,會(huì)讓自己產(chǎn)生懶惰的行文;因此,想到就去實(shí)現(xiàn),做是一切成功的前提;
第五,練習(xí)是一件好事,但是切勿目標(biāo)盲目;
第六,制定一個(gè)準(zhǔn)確的截止日期;針對(duì)每一項(xiàng)工作任務(wù),預(yù)測(cè)可能需要的時(shí)間,根據(jù)時(shí)間結(jié)點(diǎn)來(lái)評(píng)估自己的任務(wù)完成計(jì)劃;
第七,細(xì)分每一步工作計(jì)劃:對(duì)于一項(xiàng)工作任務(wù),不要盲目的去做,前提是仔細(xì)思考,細(xì)化每一個(gè)任務(wù)步驟,結(jié)合每一步任務(wù)所需要的條件即可
馬太效應(yīng)
馬太效應(yīng)(Matthew Effect),是指好的愈好,壞的愈壞,多的愈多,少的愈少的一種現(xiàn)象。即兩極分化現(xiàn)象。來(lái)自于圣經(jīng)《新約?馬太福音》中的一則寓言。
1968年,美國(guó)科學(xué)史研究者羅伯特·莫頓(Robert K. Merton)提出這個(gè)術(shù)語(yǔ)用以概括一種社會(huì)心理現(xiàn)象:“相對(duì)于那些不知名的研究者,聲名顯赫的科學(xué)家通常得到更多的聲望即使他們的成就是相似的,同樣地,在同一個(gè)項(xiàng)目上,聲譽(yù)通常給予那些已經(jīng)出名的研究者,例如,一個(gè)獎(jiǎng)項(xiàng)幾乎總是授予最資深的研究者,即使所有工作都是一個(gè)研究生完成的。”
此術(shù)語(yǔ)后為經(jīng)濟(jì)學(xué)界所借用,反映貧者愈貧,富者愈富,贏家通吃的經(jīng)濟(jì)學(xué)中收入分配不公的現(xiàn)象。
群體效應(yīng)
個(gè)體在群體的壓力下,在認(rèn)知,判斷,信念和行為等方面,自愿與全體中的多數(shù)保持一致。既個(gè)體行為總是以全體行為為參照。
產(chǎn)生的原因主要為:1.尋求行為準(zhǔn)則;2.避免孤獨(dú)感;3.群體凝聚力
????????