《模型思維》——斯科特·佩奇

聯想

1、邁克爾指出任何值得做的事情都必定會招致質疑

真理掌握在少數人手里。一個健身的女孩楊洋她教練說:“當你被所有人都理解的時候你得普通成什么樣”

2、模型是用數學公式和圖表展現的形式化結構,它能夠幫助我們理解世界

跟中學時代的數學模型、物理模型應該就是一樣的,至少本質是相近的

3、多模型方法背后的原理基于這樣一個古老的思想,那就是“管中窺豹需多管齊下”

梁啟超說每次從一個問題一個角度去看書,下次再從另一個角度去看。橫看成嶺側成峰,遠近高低各不同

4、友誼悖論:如果網絡中任何兩個節點的度不同,那么平均而言,節點的度會低于其相鄰節點。平均而言,人們的朋友比他們自己更受歡迎

《人類網絡:社會位置決定命運》也有類似的闡述。喬吉拉德說每個客戶背后都有250個關系親密的人

5、我們先來考慮一下這個管理名言:重要的事情先做。它說的是,在面對多項任務時,你應該首先完成最重要的那項任務。這個原則有時也被稱為“大石頭優先”原則,意思是當你要將一些大小不一的石頭裝入一只桶中時,你應該先裝入大石頭,如果你先放入小石頭,那么大石頭就放不下了

《如何掌控自己的時間和生活》中也著重強調先做最該做的A1重要事件。也比較符合接近28法則

6、雖然增加模型可以提高準確性(根據多樣性預測定理,必定會是這樣),但是在已經擁有了一定數量的模型之后再繼續增加模型,每個模型的邊際貢獻就會下降

過度學習到150%,再過度效果就會下降

7、群體的智慧:任何多樣性的模型(或人)的集合將比其普通成員的預測更加準確

三個臭皮匠頂個諸葛亮。頭腦風暴是公司集思廣益非常好的方式。本因坊秀哉棋力應該贏不了吳清源,但是他隨時打卦和門人一起研究對付吳清源,最后集體的智慧贏了吳清源

8、體重稍稍超標的人壽命更長

在一定范圍內身高稍微偏矮一點其實會更長壽

主題體會

要把事情做好必須具備模型思維、而且要在合理的范圍內具備多個有效的模型思維。模型思維不僅需要數學能力,更需要創造力。但是所有的模型又都是錯誤的。書中提到的模型有些就像中學時代的數學物理公式,我的理解是凝練出最本質的東西。從書中說要有模型思維但所有的模型又都是錯的,我其實并不是特別理解這個,但從這一看似矛盾的觀點讓我想到看問題要盡量正反兩面都想想,就像太極圖一樣,物極必反。

疑問

1、他曾在模型思維課程里講過一個觀點:在離散狀態馬爾科夫(數學模型)過程中,如果把人生看成努力和不努力兩個狀態,只要狀態轉移矩陣確定了,長期來看,在每個狀態下所停留的時間比例也就都確定了

2、要想成為一個有智慧的人,你必須擁有多個模型。而且,你必須將你的經驗,無論是間接的,還是直接的,都放到構成這些模型的網格上。

查理·芒格

查理芒格又說過他這輩子見過的聰明人沒有一個不是每天都閱讀的,那可以認為閱讀是有利于構建模型思維的嗎?

3、多模型思維能夠通過一系列不同的邏輯框架“生成”智慧。不同的模型可以將不同的力量分別突顯出來,它們提供的見解和含義相互重疊并交織在一起。利用多模型框架,我們就能實現對世界豐富且細致入微的理解。

4、多模型思維的成功取決于一定程度的可分離性

5、雖然,能夠推導出的東西取決于我們的假設,但是我們通過模型發現的絕不僅僅是重言式。因為我們很少能僅憑檢驗推斷出假設的全部影響,我們需要形式邏輯。邏輯還可以揭示不可能性和可能性。利用模型進行推理,我們可以得到精確的,甚至是令人出乎意料的關系。我們可以發現自身直覺的制約性

5、阿羅要求集體排序是單調的(如果每個人都將A排在B之前,那么集體排序也是如此)、獨立于無關的備選項(在其他備選項的排名發生了變化的情況下,如果任何人對A和B的相對排名都沒有發生變化,那么A和B在集體排名中的順序也不會改變),且是非獨裁的(沒有任何一個人能夠決定集體排序)

6、在向網絡中添加節點的同時,是可以減少連接所有節點所需邊的總邊長的

7、基于模型的解釋必須包括正式的假設和明確的因果鏈條,而且這些假設和因果鏈條都要面對數據

8、模型還可以通過提供框架來幫助設計,因為只有在適當的框架內我們才可以考慮不同選擇的含義

9、人們所犯的錯誤是否能夠相互抵消,取決于具體情境

10、在非策略性行為的環境中,學習機制一般能發揮作用,人們能夠學習最好的行動。我們還將證明,在策略性的博弈環境中,則“世事難料”

11、偏好要與效用函數一致,就必須滿足完備性、傳遞性、獨立性和連續性。完備性要求對所有備選方案定義偏好排序。傳遞性排除了偏好循環,也就是說,如果有人偏好A甚于B,偏好B甚于C,那么他必定偏好A甚于C。換句話說,如果一個人在蘋果與香蕉之間更喜歡蘋果,在香蕉與奶酪之間更喜歡香蕉,那么他在蘋果與奶酪之間必定更喜歡蘋果。這個條件排除了不一致的偏好。

獨立性要求人們分別評估彩票的結果

12、當我們的模型只能產生效率低下甚至糟糕的宏觀結果時,就會產生張力,愛爾法魯模型就是這種情況。在愛爾法魯模型中,一個共同的固定規則可能會導致完全無效率的周期性結果:這個星期愛爾法魯酒吧是過度擁擠的,而下個星期卻空無一人

應用

參考中學時代的數學模型、物理模型,接觸一個新事物前先嘗試構建個模型去解決它,做完后驗證反思其模型有效性,如果構建不出來就先做做完再反思總結或者做前參考做過且做的很好的人的做法。我覺得模型思維只是個名稱,最重要的是做一件事能從中總結出這件事的本質是什么,真正去理解了本質才有可能能觸類旁通,模型思維只是個工具,而且書中強調過所有模型都是錯的

新知識觀點?

1、具備模型思維的人更優秀

2、擁有多個模型能避免每個模型本身所固有的局限性(消除每個單個模型的盲點)

3、沒有模型就會受到各種認知偏差的影響:會對近期發生的事件賦予過高的權重、會根據“合理程度”分配概率、會忽略各種基本比率。沒有模型,處理數據的能力就會受到極大的限制。有了模型就能澄清相關假設且更有邏輯地進行思考,還可利用大數據來擬合、校準、檢驗因果關系與相關性。

4、所有模型都有三個共同特征:

①它們都要簡化,剝離不必要的細節,抽象掉若干現實世界中的因素,或者需要從頭重新創造。

②它們都是形式化的,要給出精確的定義。

③所有模型都是錯誤的

5、我們需要同時利用多個模型才能理解復雜系統

6、一方面,我們需要模型來連貫地思考。另一方面,任何只具有少數幾個活動部件的單個模型都無法解釋高維度的復雜現象

7、數據是缺乏意義、組織或結構的

8、柏拉圖將知識定義為合理的真實信念。更現代的定義是對相關關系、因果關系和邏輯關系的理解

9、層次結構的基礎是智慧(指識別和應用相關知識的能力)、需要多模型思維。智慧體現在懂得如何選出最優模型,智慧可通過求出各種模型的平均結果來實現。行動時有智慧的人都會應用多個模型,他們使用模型來排除某些行為、選擇某些行為。有智慧的個人和團隊會有意讓模型之間相互“對話”,探索不同模型之間的重疊和差異。

智慧包括選擇正確的知識或模型

10、構建模型方法:

①具身法:建模包括重要部分,同時對于不必要的維度和屬性,要么剝離,要么將它們整合在一起考慮。

②類比法:可對現實進行類比與抽象。

③另類現實法:有意不去表征、不去刻畫現實。

11、模型的7大用途:

推理:識別條件并推斷邏輯含義。

解釋:為經驗現象提供(可檢驗的)解釋。

設計:選擇制度、政策和規則的特征。

溝通:將知識與理解聯系起來。

行動:指導政策選擇和戰略行動。

預測:對未來和未知現象進行數值和分類預測。

探索:分析探索可能性和假說。

12、構模時先確定最重要的行為人、實體及相關特征。后描述這些組成部分如何互動和聚合,能推導出一些東西,并說明原因何在

13、辛普森悖論:每個亞種群中的女性人口比例大于男性,但在整個種群中卻是男性人口的比例更高

14、帕隆多悖論:兩個沒有勝算的賭局,當交替輪流進行時,是有可能帶來正的預期回報的

15、玻意耳定律:pV=k

16、大多數社會現象都不具備這三種性質:社會行動者是異質性的、互動是在小群體內展開的、行為人也不遵守固定的規則。(社會現象要比物理現象更加難以預測)

17、成功的拍賣制度設計必須符合這樣一些要求:不會受策略性操縱的影響、能夠產生有效率的結果,同時又容易被拍賣參與者所理解

18、啟蒙時代顯著的經濟增長在很大程度上取決于知識的可傳播性(知識通常表現為模型形式)

19、在最重要的行動中,決策者要使用多個復雜的模型,模型與數據緊密相關

20、選擇取決于用途:在預測時,我們經常需要大模型;而在解釋時,小模型則更好一些

21、多模型思維可能需要學習非常多的模型

22、在新的領域應用模型對創造力、開放性和懷疑精神的要求也非常高。我們必須認識到,并非每個模型都適合每項任務。如果一個模型無法解釋、預測或幫助我們推理,那就必須將它放到一邊,考慮其他模型

23、通過構建多個模型并使用多數規則,將比只使用其中一個模型更加準確

24、孔多塞陪審團定理:多數投票正確的概率比任何人(模型)都更高;當人數(模型數)變得足夠大時,多數投票的準確率將接近100%

25、多樣性預測定理

多模型誤差=平均模型誤差-模型預測的多樣性

26、

27、多樣性預測定理則意味著,如果能夠構建一組多樣的中等準確性的預測模型,我們就可以將多模型誤差減少為接近于零

28、對象構成了數據,將對象分為不同類別就能創造出信息,而將估值分配給各個類別則需要知識

29、數據的維數限定了可以創建的模型數量,最多可以有7個模型

30、如果能構建出多個多樣性的、準確的模型,我們就可以做出準確的預測和估值,并選擇正確的行動

31、粒度問題:在怎樣的精細程度上劃分數據

32、擁有的數據越多,模型就越精細

33、該模型的R2:一個模型中能夠解釋的變差比例

34、創造過多的類別會導致對數據的過度擬合,而過度擬合會破壞對未來事件的預測

35、分類誤差:在每個類別中,家庭的均值可能會略有不同

36、構建的類別越大,分類誤差就越大,因為類別越大,我們就越可能將具有不同均值的家庭集中到同一個類別中

37、估值誤差:因估計均值錯誤而出現的誤差

38、模型偏差:增加類別的數量能夠通過將具有不同均值的家庭歸入同一個類別減少分類誤差

39、均值方差的增加:構建更多類別則會增加對每個類別均值估計的誤差

40、模型誤差分解定理

偏差-方差權衡

模型誤差=分類誤差+估值誤差

41、

42、成功的一對多思維取決于創造性地調整假設和構建新的類比,以便將為某個特定目的而開發的模型應用到新的領域

43、理性行為者模型是起到“黃金標準”的作用,還是“稻草人”的作用,抑或是介于這兩者之間,都取決于模型的目的

44、構建與人相關的模型時,一個主要的挑戰是如何準確評估他們的目標和目的

45、人們愿意生活在一個“融合”的社區中,但如果與自己同一種族的人在社區中的比例低于10%,人們就選擇離開。

46、對人建模的最后一個挑戰來自人的主體性:我們有采取行動的能力,改變行為的能力以及學習的能力

47、人們采取的學習方式因環境而異。為了搞清楚自己需要學習多少個小時才能在考試中取得好成績,或者自己需要每個星期鍛煉多少次才能保持好身材時,人們可以根據個人經歷或通過內省來學習

48、理性行為者模型

行為者個體的偏好由在一組可能的行為上定義的數學形式的效用函數或收益函數來表示。行為個體選擇函數值最大化的行動。在博弈中,這種選擇可能需要相信其他博弈參與者的行為

49、使用效用函數能使模型成為可分析、可檢驗且易于處理的。我們可以用數據估計函數,可以推導出最優行為,還可以通過更改參數值來提出各種各樣“如果……將會怎樣”的問題

50、選擇理性行為者模型的理由

“似乎”:基于智能規則做出的行為可能與最優或近似最優行為無法區分。

學習:在重復的情況下,人們應該能夠接近最優行為。

大的“賭注”:在重大決策中,人們會收集信息并認真思考。

唯一性:最優行為通常是唯一的,從而使模型成為可檢驗的。

一致性:最優行為創建一致的模型。如果人們學會了利用這樣的模型,就不會改變自己的行為。

基準:最優行為提供了一個基準,作為人們認知能力的上限

51、人在決策時會受到各種各樣的偏差(包括現狀偏差)的影響

52、快速、直觀的基于規則的思考(快思考)和深思熟慮(慢思考)。快思考更容易受到上述各種偏差的影響。從長遠來看,我們可以從大腦的結構中推斷出一些行為模型,但是一定要記住,大腦具有巨大的可塑性。能夠通過慢思考來克服各種偏差

53、在嘗試構建更符合現實的模型時,我們必須牢記易處理性這個原則

54、損失厭惡:面對收益時,人們表現為風險厭惡,面對損失時,人們卻表現為風險偏好

55、雙曲貼現意味著,人們對近期的貼現更強

56、根據對模型用途的設想,我們可以選擇假設損失厭惡和雙曲貼現,只要這些假設似乎更能匹配大多數人的行為

57、在基于最優化的模型中,對偏好或收益的假設是最基本的;而在基于規則的模型中,對行為的假設才是最基本的

58、行為規則既可以是固定的,也可以是適應性的。固定規則意味著始終適用相同的算法。

59、市場中一個常見的固定規則是零智能規則:接受任何能夠帶來更高收益的報價。這個規則意味著永遠不會采取愚蠢的(即減少效用的)行動

60、愛爾法魯模型:適應性規則

有100個人,每個人每個星期都要獨立地決定是否前往愛爾法魯酒吧。如果決定前往,且只有60個人或更少的人到場,那么這個人的收益為1,否則收益為-1,決定不前往愛爾法魯酒吧的人收益為0。

每個人都有一套規則來決定是否參加。這些規則可以是固定的,也可以依最近一段時間以來的參加人數而定。每個星期,每個人都要按照遵循他的規則集合中曾產生過最高收益的規則行事

61、為了達到均衡,我們并不需要假設最優化行為。人們可以通過遵循簡單的規則來產生均衡;在這種均衡中,任何人都無法通過改變自己的行為來讓自己受益

62、最優行為可能是一種不切實際的假設,特別是在復雜情況下。另一方面,如果一個系統產生了穩定的結果,而且某個人可以采取更好的行動,那么這個人很可能會找到這種更好的選擇

63、盧卡斯批判

政策或環境的變化可能引起受影響者的行為反應。因此,使用過去的行為數據估計的模型將不準確。模型必須考慮到人們對政策和環境變化做出反應這一事實

64、中心極限定理

只要各隨機變量是相互獨立的,每個隨機變量的方差都是有限的,且沒有任何一小部分隨機變量貢獻了大部分變差,那N≥20個隨機變量的和就近似一個正態分布。

中心極限定理一個非常重要的特征是,隨機變量本身不一定是正態分布的。它們可以有任何分布,只要每一個隨機變量都具有有限的方差,并且它們中的任何一小部分隨機變量都不貢獻大部分方差

65、多重效應會導致更大的不平等

66、所有正態分布的圖形看上去都是相似的,大約68%的結果在均值的一個標準差內,大約95%的結果在兩個標準差內,并且超過99%的結果在三個標準差內

67、平方根法則(The square root rules)

N個相互獨立的隨機變量,都具有標準差σ,對這些隨機變量的值的標準差σμ和對這些隨機變量總和的標準差σΣ,分別由以下公式給出:4

[插圖]

均值的標準差公式表明,大的總體的標準差要比小的總體的標準差低得多。由此可以推斷,在小的群體中應該會觀察到更多的好事和更多的壞事

68、產生冪律分布要求非獨立性,通常以正反饋的形式出現

69、冪律分布

一個定義在區間[xmin,∞)上冪律分布5可以寫成如下形式:

P(x)=Cx-a

其中,指數a>1決定了尾部的長度,同時常數項[插圖]確保總概率的分布。

冪律中指數的大小決定了大事件的可能性和大小。當指數等于2時,事件的概率與其大小的平方成比例。大小為100的事件,發生的概率與[插圖](或一萬分之一)成比例。當指數增加到3時,該事件的概率與[插圖]成比例。對于2或更小的指數,冪律分布缺乏一個可明確定義的均值。例如,從指數為1.5的冪律分布中抽取出來的數據均值永遠不會收斂。換句話說,它會無限地增加

70、齊普夫定律

對于指數為2的冪律分布(a=2):事件等級×事件大小=常數

71、優先連接模型

一連串物體(人)一個接一個地到達。第一個到達者創建一個實體。后續每次有人到達時都應用以下規則:在概率p(較小)的情況下,新到達者創造一個新的實體;在概率(1-p)的情況下,新到達者加入現有的某個實體。加入某個特定實體的概率等于該實體的大小除以到目前為止所有到達者的數量

72、自組織臨界模型,它通過在系統中建立相互依賴關系的過程產生冪律分布,直到系統達到臨界狀態為止

73、森林火災模型

“森林”最初只是一個空的N×N網格。每個周期在網格上隨機選擇一個格點。如果該格點為空,那么就以概率g在那里種上一棵樹。如果該格點上已經有樹,那么閃電會以概率(1-g)擊中該格點。如果該格點有一棵樹,那么樹會著火,火勢會蔓延到所有連接到該格點的有樹的格點

74、長尾分布的三個含義,即它們對公平、災難和波動性的影響

75、社會效應會創造更大的贏家

76、如果組成冪律分布的實體規模出現了波動,那么冪律的指數就可以作為衡量系統層面波動性的一個代表。由此可以推斷,企業規模的分布應該會影響市場波動性

77、長尾分布是由于反饋和相互依賴性而產生的

78、機會的增加可以創造風險激勵

79、線性模型

在線性模型中,自變量x的變化,會導致因變量y的線性變化,用如下方程表示:

y=mx+b

其中,m等于直線的斜率,b等于截距,即當自變量等于0時的因變量值

線性回歸模型的目標是找到能夠最小化到各數據點的直線

線性回歸可以告訴我們關于自變量系數的如下內容:

符號:自變量與因變量之間的正相關或負相關。

顯著性(p值):系數上非零符號的概率。

大小:對自變量系數的最佳估計

80、實力-運氣方程

成功=a×實力+(1-a)×運氣

其中,a位于區間[0,1]上,是技能的相對權重

81、如果不同的參賽者之間實力差異很小,那么運氣就會在很大程度上決定誰輸誰贏。我們可以預期,在競爭最激烈的比賽中,比如奧運會,進入決賽的選手之間的實力差異很小,因而運氣就非常重要了。莫布森把這種情況稱為“實力悖論”

82、大系數與新現實

線性回歸揭示了自變量與我們感興趣的(因)變量之間的相關程度。如果這種相關是因果關系,那么具有大系數變量的變化就會產生很大的影響。基于大系數的政策在保證能夠帶來改進的同時,排除了涉及更多根本性變化的新現實

83、指數增長模型

時間t的資源值Vt,其初始值為V0,且以速率R增長,可以寫成如下方程:

Vt=V0(1+R)t

84、72法則

如果一個變量在每個周期內以R(增長率小于15%)的百分比增長,那么下面提供了一個很好的近似:

[插圖]

72法則量化了最高增長率的累積效應

85、具有正斜率的凸函數會以遞增的值增加,具有負斜率的凸函數就會變得不那么陡峭,也就是說,最初具有較大負斜率的凸函數將逐漸走平

86、所有有機物都包含兩種形式的碳:不穩定的同位素碳-14,以及穩定的同位素碳-12

87、通過測量碳-14與碳-12的比例,就可以估計化石或人工制品的“年齡”,這種技術被稱為放射性碳年代測定法

88、半衰期模型

如果每H周期,剩余數量的一半會衰減,那么在t周期后,剩余的比例為:

[插圖]

半衰期模型的一個新應用是在心理學中。早期的心理學研究表明,人們幾乎以接近固定不變的速度忘記信息。人們記憶的半衰期取決于事件的顯著性

89、凹函數與凸函數相反。凹函數的斜率是遞減的。具有正斜率的凹函數會呈現收益遞減的特點:當我們擁有的東西越來越多的時候,每個額外東西所能帶來的價值會越來越少

90、柯布-道格拉斯模型

給定L個工人和K個單位資本,總產出如下所示:

產出=常數×LaK(1-a)

其中a是介于0到1之間的實數,表示勞動力的相對重要性。

91、簡單增長模型

產出函數:[插圖]

投資規則:I(t)=s×O(t)

消費-投資方程:O(t)= C(t)+I(t)

投資-折舊方程:M(t+1)= M(t)+I(t)-d×M(t)

其中,O(t)=產出,M(t)=機器,I(t)=投資,C(t)=消費,s=儲蓄率,d=折舊率

92、索洛*增長模型

經濟體中的總產出由以下方程給出:

[插圖]

其中,L表示勞動量,K表示實物資本量,A表示技術水平。長期均衡產出O*由下面的方程給出:13

[插圖]

長期均衡產出隨勞動力數量的增加、技術的進步、儲蓄率的提高而增加,同時隨折舊率的上升而下降

93、創新有兩個效應。首先,創新直接增加產出;其次,創新間接導致更多的資本投資,從而導致產出再次增加。因此,創新是持續增長的關鍵

94、減少攫取和腐敗以及促進創新,都能推進經濟增長

95、一旦包括了非線性,直覺就變得不夠用了

96、我們定義了度量價值和權力的兩個標準。第一個標準是“最后上車者價值”(last-on-the-bus value,簡稱LOTB),它等于一位行動者在團隊已經形成的情況下加入團隊時的邊際貢獻。第二個標準是夏普利值(Shapley value),它等于行動者遍歷所有可能的加入團隊的序列,加入團隊時的邊際貢獻平均值

夏普利值

給定合作博弈{N,V},夏普利值的定義如下:

N個博弈參與者加入聯盟的次序有N!個,讓O代表這所有N!個次序。對于O中的每一個次序,將博弈參與者i增加的價值定義為當博弈參與者i加入時價值函數發生的變化。博弈參與者i的夏普利值等于他在O中所有次序上增加價值的平均值

97、合作博弈

合作博弈由N個博弈參與者和一個價值函數組成。這個價值函數為任何子集S?N分配一個值V(S)賦值。這些子集稱為聯盟。沒有博弈參與者組成的聯盟的價值等于零,即[插圖]。所有N個博弈參與者的價值V(N)等于博弈的總價值

98、夏普利值的公理基礎

夏普利值唯一滿足以下公理:

零性:如果博弈參與者為任何聯盟增加的價值都等于零,那么該博弈參與者的價值等于零。

公平性/對稱性:如果兩個博弈參與者對任何聯盟都具有相同的增加價值,那么這兩個博弈參與者具有相同的價值。

完全分配性:博弈參與者價值的總和等于博弈的總價值V(N)。

可加性:給定兩個定義在相同博弈參與者集合之上的博弈,它們的價值函數分別為V和[插圖],那么在博弈(V+[插圖])中,一個博弈參與者的價值等于該博弈參與者在V和[插圖]的價值的總和

99、一個政黨控制的席位百分比與它實際擁有的權力之間可能存在著脫節

100、網絡由節點以及連接節點的邊(edge)組成。由邊連接起來的節點互為鄰居。如果沿著邊,可以從任何一個節點到達任何其他節點,就將這樣的網絡稱為連接的網絡

101、網絡統計量

度:節點的鄰居數(即邊數)。

路徑長度:從一個節點到另一個節點必須遍歷的最小邊數。

介數:經過某個節點連接兩個其他節點的最短路徑數量。

聚類系數:一個節點的鄰居對當中,同樣也由一條邊連接的鄰居對所占的百分比

102、隨機網絡的蒙特·卡羅方法[插圖]

為了檢驗一個具有N個節點和E條邊的網絡是不是隨機網絡,可以創建大量具有N個節點和E條邊的隨機網絡,并計算出度、路徑長度、聚類系數和介數的分布。然后,執行標準的統計檢驗,以確定接受還是拒絕那個網絡的統計數據可能抽取自該模擬分布的假設。

103、質量和度的網絡形成模型

創建d個互不連接的節點。在每周期t中創建一個質量為Qt的、從分布F中抽取出來的新節點。根據其他d個節點的度將這個新節點連接到那些節點上。用Dit表示在時間t時節點i的度,那么給定N個節點時選擇節點i的概率等于:

[插圖]

104、大多數人之間用不著6度就可以連接起來了

六度分隔

假設每個節點有100個“圈內好友”(C),他們彼此都是朋友;以及20個隨機朋友(R),他們沒有與節點共同的朋友。

一度:C+R=120

二度:CR+RC+RR=2000+2000+400=4400

三度:CRC+CRR+RCR+RRC+RRR=328000

四度13:17360000

五度:>10億

六度:>200億

105、網絡最重要的性質是,它在受到沖擊時是不是仍然能保持連接

106、缺乏局部聚類的稀疏網絡更容易出現故障

107、互聯網的度分布意味著,絕大多數節點的連接很少,因此即便它們發生了故障,網絡也能保持連接

108、SIR模型

[插圖]

其中,Precover,Pspread,和Precover分別等于傳染病的傳播概率、接觸概率和痊愈概率

SIR模型會產生一個臨界點,在臨界點上,產品或傳染病性質的微小變化,就意味著失敗與成功之間巨大分野

109、廣播模型

It+1=It+Pbroad×St

其中,Pbroad表示廣播概率,It和St分別等于時間t上的感染者(知情者)和易感者的數字

初始狀態為I0=0,且S0=NPOP。

110、擴散概率(diffusion probability)定義為接觸概率(contact probability)和分享概率(sharing probability)的乘積

111、擴散模型

[插圖]

其中,Pdiffuse=Pspread×Pcontact

112、巴斯模型

[插圖]

其中,Pbroad=廣播概率,Pdiffuse=擴散概率

113、熵是對不確定性的一個正式測度。利用熵,我們可以證明不確定性、信息內容與驚喜之間的等價性。低熵對應于低不確定性,同時揭示的信息很少。熵在數學上等于概率與它們的對數之和的相反數

114、信息熵

給定一個概率分布(p1,p2,…pN),信息熵,H2等于:

[插圖]

注:上面的下標2表示使用的是以2為底的對數

115、公理基礎:熵

[插圖],其中,a>0。

這種熵測度是唯一滿足以下四個公理的測度:

對稱性:對于任何轉置概率,都有連續函數[插圖]。

最大化:對于所有N,[插圖]處最大化。

零性:H(1,0,0,…0)=0。

可分解性:如果[插圖]

[插圖]其中,[插圖]

116、最大熵分布

均勻分布:給定范圍[a,b],使熵最大化。

指數分布:給定均值μ,使熵最大化。

正態分布:給定均值μ和方差σ2,使熵最大化

117、伯努利甕模型

每一次,從一個裝了G個灰球和W個白球的甕中隨機抽取一個球,結果等于抽取出來的球的顏色。在下一次抽取之前,球要先放回甕中。令[插圖]表示灰球的比例。在抽取N次的情況下,可以計算出抽取出來的灰球的期望數量NG,及其標準差[插圖]

118、簡單隨機游走模型

Vt+1=Vt+R(-1,1)

其中,Vt表示時間t上的隨機游走值,V0=0,R(-1,1)是一個可能等于-1或1的隨機變量。在任何時間段內,這個隨機游走的期望值都等于零,且標準差為[插圖],其中的t等于周期數

119、結果路徑依賴是指每一周期的結果都取決于先前的結果

120、波利亞過程

一只甕里面裝著一個白球和一個灰球。每一周期,都隨機抽取出一個球并將這個球與和它顏色相同的另一個球一起放回到甕中。抽取出來的球的顏色表示結果

121、均衡過程

一個甕包含一個白球和一個灰球。每一周期都隨機抽取出一個球,并將與抽取出來的球顏色相反的球與抽取出來的那個球一起放回到甕中。球的顏色表示結果

122、風險價值(value at risk,VaR)衡量的是在某個特定時間段內損失特定金額的概率

123、局部多數模型

二維方格上的每個單元都處于兩種狀態之一:開或關。每個單元有8個鄰居。2在每個周期中,隨機選擇一個元胞。3當且僅當其中它的5個或更多鄰居處于另一個狀態時,這個元胞才會改變自己的狀態

124、純粹協調博弈

在純粹協調博弈(pure coordination games)中,每個博弈參與者都要在兩個行動A或B中選擇一個。如果兩個博弈參與者都選擇了相同的行動,那么每個博弈參與者的收益為1。如果兩個人各自選擇了不同的行動,那么每個人的收益都為零。

[插圖]

一個純粹協調博弈有兩個有效的均衡:兩個博弈參與者選擇A或者兩個博弈參與者選擇B。它還有一個無效的均衡,也就是每個博弈參與者都在A和B之間進行隨機選擇。我們可以從純粹協調博弈的角度重新解釋局部多數模型:在這個博弈中,每個元胞都是一個博弈參與者,它必須選擇一個共同行動來對抗它的8個鄰居。如果博弈參與者只有在隨機激活時才能改變行動,那么某個博弈參與者就可以通過選擇與它的大多數鄰居所選擇的行動相匹配的行動來增加自己的收益。這種策略被稱為短視最優響應(myopic best response),因為它沒有考慮到鄰居可能的未來行為。

一個博弈參與者有5個鄰居選擇了B,那么這個博弈參與者可以通過從A切換到B來在短期內增加自己的收益,但是,如果這個博弈參與者和鄰居是被其他選擇A的博弈參與者的“海洋”所包圍的一個孤島,那么這個博弈參與者保持A不變反而可能獲得更高的期望收益。最關鍵的一點是,局部多數模型中的行為規則雖然只是一個假設的規則,但卻可以植根于博弈論模型中

125、協調的悖論

如果人們是在局部進行協調的,那么從全局的角度來看,整體配置將會是斑塊狀的、多樣性的

126、當技術和城市化使人與人之間的聯系更加緊密之后,協調的力量可以產生更大的同質性行為和信念

127、生命游戲

方格上的每個元胞都或者是活的(開的)或者是死的(關的)。每個元胞的鄰居由網格上的8個相鄰元胞組成。元胞根據如下兩個規則同步更新自己的狀態:

活的規則:對于一個死元胞,當恰好有三個活的鄰居時,這個死元胞就會變活。

死的規則:對一個活元胞,當活的鄰居小于兩個時或當有三個以上的活鄰居死去時,這個活元胞就會死去

128、一個離散動態系統(discrete dynamical system)由可能的配置空間,以及一個轉移規則(transition rule)組成。我們可以把配置空間視為世界的多維狀態,例如生命游戲中的活元胞和死元胞的初始集合,而轉移規則則是將時間t時的配置映射到時間t+1時的配置上。

一個李雅普諾夫函數是從配置到實數的一個映射,它滿足兩個假設:第一,如果轉移函數不處于均衡狀態,則李雅普諾夫函數的值就會減少某個固定的數量(對此,稍后會給出更多的解釋);第二,李雅普諾夫函數具有最小值。如果這兩個假設成立,那么該動態系統必定達到均衡。

李雅普諾夫函數

給定一個離散時間動態系統,它的轉移規則由xt+1=G(xt)組成。對于實值函數F(xt),如果對于所有的xt,都有F(xt)≥M,而且存在一個A>0,那么下式成立,這個實值函數F(xt)是李雅普諾夫函數:

F(xt+1)≤F(xt)-A,如果G(xt)≠xt

如果對于G,F是一個李雅普諾夫函數,那么從任何x0開始,必定存在一個t*,使G(xt*)=xt*,即該系統會在有限時間內達到均衡。

首先為逐底競爭博弈構建一個李雅普諾夫函數。這個函數刻畫了該博弈的博弈參與者的策略環境,以便每一個博弈者都更愿意提供恰好低于平均水平的水平。

逐底競爭博弈

有N個博弈參與者,每個博弈參與者在每個時期都要提出一個支持水平,其取值范圍為{0,1,…,100}。提出了最接近平均支持水平2/3的博弈參與者可以獲得那個期間的獎勵

129、一個離散動態系統(discrete dynamical system)由可能的配置空間,以及一個轉移規則(transition rule)組成。我們可以把配置空間視為世界的多維狀態,例如生命游戲中的活元胞和死元胞的初始集合,而轉移規則則是將時間t時的配置映射到時間t+1時的配置上。

一個李雅普諾夫函數是從配置到實數的一個映射,它滿足兩個假設:第一,如果轉移函數不處于均衡狀態,則李雅普諾夫函數的值就會減少某個固定的數量(對此,稍后會給出更多的解釋);第二,李雅普諾夫函數具有最小值。如果這兩個假設成立,那么該動態系統必定達到均衡。

李雅普諾夫函數

給定一個離散時間動態系統,它的轉移規則由xt+1=G(xt)組成。對于實值函數F(xt),如果對于所有的xt,都有F(xt)≥M,而且存在一個A>0,那么下式成立,這個實值函數F(xt)是李雅普諾夫函數:

F(xt+1)≤F(xt)-A,如果G(xt)≠xt

如果對于G,F是一個李雅普諾夫函數,那么從任何x0開始,必定存在一個t*,使G(xt*)=xt*,即該系統會在有限時間內達到均衡。

首先為逐底競爭博弈構建一個李雅普諾夫函數。這個函數刻畫了該博弈的博弈參與者的策略環境,以便每一個博弈者都更愿意提供恰好低于平均水平的水平。

逐底競爭博弈

有N個博弈參與者,每個博弈參與者在每個時期都要提出一個支持水平,其取值范圍為{0,1,…,100}。提出了最接近平均支持水平2/3的博弈參與者可以獲得那個期間的獎勵

130、一個離散動態系統(discrete dynamical system)由可能的配置空間,以及一個轉移規則(transition rule)組成。我們可以把配置空間視為世界的多維狀態,例如生命游戲中的活元胞和死元胞的初始集合,而轉移規則則是將時間t時的配置映射到時間t+1時的配置上。

一個李雅普諾夫函數是從配置到實數的一個映射,它滿足兩個假設:第一,如果轉移函數不處于均衡狀態,則李雅普諾夫函數的值就會減少某個固定的數量(對此,稍后會給出更多的解釋);第二,李雅普諾夫函數具有最小值。如果這兩個假設成立,那么該動態系統必定達到均衡。

李雅普諾夫函數

給定一個離散時間動態系統,它的轉移規則由xt+1=G(xt)組成。對于實值函數F(xt),如果對于所有的xt,都有F(xt)≥M,而且存在一個A>0,那么下式成立,這個實值函數F(xt)是李雅普諾夫函數:

F(xt+1)≤F(xt)-A,如果G(xt)≠xt

如果對于G,F是一個李雅普諾夫函數,那么從任何x0開始,必定存在一個t*,使G(xt*)=xt*,即該系統會在有限時間內達到均衡。

首先為逐底競爭博弈構建一個李雅普諾夫函數。這個函數刻畫了該博弈的博弈參與者的策略環境,以便每一個博弈者都更愿意提供恰好低于平均水平的水平。

逐底競爭博弈

有N個博弈參與者,每個博弈參與者在每個時期都要提出一個支持水平,其取值范圍為{0,1,…,100}。提出了最接近平均支持水平2/3的博弈參與者可以獲得那個期間的獎勵

131、自組織活動模型

一個城市里,有A種活動可以參加,每一天都由L個時間段組成。在人口規模為M的城市中,每個人都要選定一個日程安排。在這里,日程安排是指這個人在L個時間段內分配L種活動(從一個更大的K種可能性的集合中)。一個人要面對的擁擠水平則設定為等于同時選擇同一種活動的其他人的數量

132、純交換經濟由一個消費者集合組成,每個消費者都有自己的商品稟賦和偏好

133、取一半或乘三加一法則”(HOTPO),它也被稱為考拉茲猜想

134、在馬爾可夫模型中,狀態之間轉移發生的概率是固定的

135、在統計均衡中,單個實體可以繼續在各種狀態之間移動,但是各種狀態之間的概率分布仍然是固定的

136、首先,馬爾可夫模型允許結果是路徑依賴的,接下來會發生的事情將取決于當前的狀態。其次,馬爾可夫模型還允許對歷史記錄進行長期建模,但對于這種情況,模型的某個假設必定會被違背

137、佩龍-弗羅賓尼斯定理(Perron-Frobenius Theorem)

一個馬爾可夫模型必定收斂于一個唯一的統計均衡,只要它滿足如下四個條件:

狀態集有限:S={1,2,…,K}。

固定轉換規則:狀態之間的轉移概率是固定的,即在每個周期中,從狀態A轉換為狀態B的概率總是等于P(A,B)。

遍歷性(狀態可達性):系統可以通過一系列轉換從任何狀態到達任何其他狀態。

非循環性:系統不會通過一系列狀態產生確定的循環。

138、銷量-耐久性悖論

銷量-耐久性悖論(sales-durability paradox)說的是,產品或創意的流行程度與其說取決于它們的相對銷量,不如說取決于它們的耐久性。只需要將擁有某種類型商品的人的比例設定為狀態,就可以用馬爾可夫模型來解釋這個悖論。在這里我們考慮兩種不同的地板,一種是瓷磚(耐用品),另一種是油氈(銷量更大的商品)。當銷量更大的商品(在這里這個例子中是油氈)不那么占主流時,就會產生這種悖論。

在我們的模型中,假設油氈的銷量是瓷磚的3倍。為了刻畫耐久性差異,假設每年有1/10的人必須更換他們的油氈地板,而需要更換瓷磚的人則只有1/60。在由此而得到的馬爾可夫模型的均衡中,有2/3的地板都是用瓷磚鋪就的。4

銷量-耐久性悖論背后的邏輯,也可以用來解釋市場份額與品牌忠誠度(某人改用其他品牌的產品的可能性)之間的正相關關系。在馬爾可夫模型中,更低的品牌忠誠度在均衡狀態時必然意味著更低的市場份額,因為忠誠度所起的作用就像耐久性一樣。這種經驗規律有時也被稱為“禍不單行法則”(double jeopardy law)。如果一個企業的產品的品牌忠誠度較低,那么其銷售量往往也較低

139、馬爾可夫決策模型

馬爾可夫決策模型(Markov decision model)是對馬爾可夫模型的一種修正,方法是將行動包括進來,行動會帶來回報,而回報則以狀態為條件,還會影響狀態之間的轉移概率。考慮到行動對轉移概率的影響,最優行動并不一定是能夠最大化即時回報的那個行動

140、任何一個系統動力學模型都由源、匯、存量和流量組成。源產生存量;存量是某個變量的數量或水平;流量描述了存量水平的變化;匯能夠捕獲來自存量的流量輸出;匯和源是不包含在模型中的過程的“占位符”;存量水平會根據源和流量隨時間推移而變化

141、洛特卡-沃爾泰拉方程

假設一個生態系統由H只野兔和F只狐貍構成。野兔的數量以g的速度增長,狐貍的數量則以d的速度減少。當野兔和狐貍相遇時,野兔以a的速度死亡,狐貍以b的速度增長。根據這些假設,可以給出如下微分方程組:3

[插圖]

從這個微分方程組可以推導出兩個均衡,一個是滅絕均衡,即F=H=0;一個是內點均衡,即[插圖]和[插圖]給出

142、WORLD3模型包括了在一個共同的框架內以不同速度增長的多個彼此互動的過程,因而利用它,決策者能夠看到各種各樣的相互依賴關系。這個模型包含了大約150個變量、300個方程和500個參數,生育率、經濟增長率和土地使用率等無不包括在內

143、騷亂模型

假設有N個人(用i來索引),每一個人都有一個“騷亂閾值”(riot threshold),不妨記為T(i)∈{0,1,…,N}。在一開始,騷亂總產值為零,即T(i)=0的那些人都會參加騷亂。令R(t)等于在時間t參加騷亂的人的數量。在時間t上,如果T(i)<R(t-1),那么第i個人就會參加騷亂

144、騷亂模型有各種各樣的變體,可以用來分析人們什么時候會起立鼓掌、人們的觀點會怎樣變化(例如,會不會接受同性婚姻)、時尚潮流的改變(例如,愿不愿意佩戴蝶形領結),以及市場動態演變

145、謝林派對模型

N個人參加一個派對,每個人都有一個可觀察的類型A或B。每個人隨機選擇兩個房間中的一個。在每個時刻,每個人都有p的概率走到另一個房間去。第i個人的寬容閾值為Ti。對于這個人,如果他所屬的類型的人在當前房間內所有人當中所占的比例低于這個閾值,他就離開這個房間

146、謝林隔離模型

有N個人,每個人都屬于類型A或類型B,隨機排列在一個M×M的棋盤上。棋盤上還有部分空間未被占用。第i個人的寬容閾值為Ti。對于這個人,如果他所在方格的8個相鄰方格中同一類型的人所占的百分比低于他的閾值,就會重新定位到一個隨機的新方格上

147、乒乓球模型

規模為N的種群中的每一個實體隨機采取一個初始行動,或者為正(+1),或者為負(-1)。系統的初始狀態S0設置為零。系統的所有未來狀態St則等于平均行動再加上一個隨機變量,即:

[插圖]

每個實體i都有一個響應閾值(response threshold)Ti>0,它從[0,RANGE]中均勻抽取出來。如果狀態的絕對值大小|St|小于它的閾值,該實體就采取與以前相同的行動,否則,就采取減少狀態絕對值大小的行動。即:

如果|St|≤Ti,那么Ai(t+1)=Ai(t),否則Ai(t+1)=-signSi(t)

其中,εt是從{-1,+1}中隨機抽取出來的

148、正反饋強化行動,負反饋抑制行動。只有正反饋的系統會爆炸或崩潰,只有負反饋的系統將穩定或循環,同時具有正反饋和負反饋的系統則可能會產生復雜性

149、空間競爭模型

備選項包括N個空間屬性:[插圖]。

做出選擇的個體的理想點:[插圖]。

個體選擇了備選項后得到的收益(效用)等于:[插圖],其中,C>0是一個常數

150、享受競爭模型

備選項包括N個效價屬性(valence attribute):[插圖]。

個體用各個屬性上的權重來表示:[插圖]。

151、享受模型:這個模型根據商品的內在屬性解釋商品的價值。估值的差異取決于對商品屬性的不同潛在偏好。這些屬性可能是商品的物理組成部分

152、協調模型:這種模型將價格解釋為社會建構的。戈雅畫作的價值取決于其他人相信它真的有那么高的價值。在最初,人們對戈雅畫作的價值有自己的看法。然后,他們與社會網絡中的其他人互動并更新自己的看法。兩個人都可以將他們的價值設定為等于兩人估價的平均值,一個人可以改變他的估價以匹配另一個人給出的價值,或者每個人都可以根據其他人的估價來調整自己的估價。給定這三種假設中的任何一種,估價都可以實現局部收斂。這樣,相互之間有聯系的人將會具有類似的估值。分配給商品的最終價值將取決于價值的初始分布、社會網絡以及配對發生的順序

153、預測模型:這類模型將價格解釋為對未來價值的預測。根據這種模型,佛羅里達州奧卡拉市的土地價值、比特幣或股票價值,都取決于人們將來愿意為它們付出多少錢。這些估值取決于預測模型,而預測模型又取決于屬性和類別。我們可能會將奧卡拉市歸類為氣候溫暖的、稅率很低的非沿海城市。人們的估值的變化源于不同的預測模型。投資者會使用多種預測模型。這些模型可能依賴于屬性,或者,就像對比特幣進行估價一樣,也會對協調做出假設

154、標準式零和博弈(two-player normal-form zero-sum games)。在這種博弈中,每個博弈參與者選擇一個行動,并根據博弈參與者自己的行動和另一個博弈參與者的行動獲得一定收益。此外,博弈參與者雙方的收益總和為零

155、博弈的納什均衡(Nash equilibrium)是指這樣一種策略,它們能夠使每個博弈參與者的策略在給定其他博弈參與者策略的情況下是最優的

156、這種一方為另一方排除最優策略被稱為迭代消除被占優策略

157、在序貫博弈中,博弈參與者按照某個特定的順序采取行動

158、在連續行動博弈中,行動對應于努力水平。通過選擇更大的努力,博弈參與者能夠增大自己贏得獎勵的概率。這個博弈還允許考慮任意大數量的博弈參與者

159、努力博弈

N個博弈參與者中的每一個人都要選擇以貨幣形式表達努力水平,以贏得價值為M的獎勵。一個博弈參與者贏得獎勵的概率等于他的努力水平除以所有博弈參與者的總努力水平。如果令Ei表示博弈參與者i的努力水平,那么他的獲勝概率由以下方程式表示:1

[插圖]

均衡努力水平為:[插圖]

160、同伴效應模型用博弈論來解釋聚類現象,即一個人與他的朋友一起進行協調博弈。而在分類模型中,人們會“遷移”到與他們相似的其他人附近。一群優秀的學生之所以聚在一起,可能是因他們要協調完成某個共同行動(同伴效應),或者也可能是因為優秀的學生就喜歡找優秀的學生一起玩(分類效應)。如果只有數據快照(snapshot of data),那么這兩者是無法區分的

161、分類模型:學生最初先會形成一些人數為4的隨機小組。在具有兩種類型的任何一個小組中,與至少兩個其他人的類型相反的人,會與相反類型的某個人交換小組。也就是說,{H,H,H,M}會變為{H,H,H,H},而且{M,M,M,H}會變為{M,M,M,M};并且,任何{H,H,M,M}這種形式的小組有同樣的概率成為{H,H,H,M}或{M,M,M,H}。

兩個模型都與數據一致,從而導致了識別問題。只有數據快照,我們無法確定吸煙、看漫畫書或喜歡滑板到底因為同伴效應導致的,還是因為分類效應導致的。在某些情況下,我們可以推斷出使用哪種模型更好。例如,美國中西部地區的人們喜歡說“pop”(泡泡)、沿海地區的人們喜歡說“soda”(蘇打),對于這種傾向,我們可以有把握地認為這是由同伴效應驅動的,因為很少從外地移居波士頓的人,會將可口可樂稱為“蘇打水”。但是,對于某些利害關系更大的行為,例如學業成績、濫用藥物、肥胖和幸福,就需要用更多的時間序列數據來識別哪種模型才適用了。利用時間序列數據,我們就可以分辨出人們到底是在改變自己的行為(同伴效應),還是在更換他們的朋友(分類效應)。在許多情況下,這兩個因素都有。2

162、重復博弈維持合作

在重復囚徒困境博弈中,如果繼續進行下一次博弈的概率P超過了誘惑收益T減去獎勵收益R的差與誘惑支付的比,那么采用冷酷觸發策略就能維持合作

163、連通性與聲譽

通過聲譽機制維持合作有一個條件:個體必須能夠知悉自己鄰居的行為偏離合作的可能性。為了評估關于這種行為偏差的信息傳播出去的可能性,我們可以應用在向傳染病模型中加入網絡時學到的三個結果。首先,網絡的度越大,關于偏離合作行為的信息傳播出去的可能性就越大。其次,度分布的變化,特別是超級傳播者的存在,也會增加信息傳播出去的可能性。再次,如果一個人所背叛的那個受害者,與這個人的其他鄰居沒有任何聯系,那么這個人的鄰居就不會知道這個人背叛了他人。因此,要保證聲譽擴散,網絡必須具有很高的聚類系數,而聚類系數又是社會資本的一個衡量指標

164、冷酷觸發策略是一開始選擇合作,后面也一直繼續合作,直到另一個博弈參與者背叛為止,然后就一直背叛。始終合作和始終背叛這兩種策略與名字的含義一樣:盲目地選擇合作或背叛,無論其他博弈參與者的行為如何。針鋒相對(或一報還一報)是指在第一次合作,然后每一次都復制另一個博弈參與者在前一次中的行為,兩個人都使用針鋒相對策略的博弈參與者將永遠合作。欺負好人策略則剝削始終合作的博弈參與者,更具體地說,這種策略是,在前兩次選擇背叛,如果另一個博弈參與者在這兩次都沒有背叛過,那么就選擇永遠背叛;而如果另一個博弈參與者在前兩次已經背叛過了,那么就先轉而在接下來的兩次選擇合作,然后一直采用冷酷觸發策略

165、合作行動模型

一個種群由N個人組成,他們或者是合作者,或者是背叛者,連接于一個網絡中。在每一次互動中,合作者都要承擔合作成本C,而其他人則可以獲得合作收益B。背叛則不會產生任何成本和收益。合作優勢比率B/C刻畫了合作的潛在收益

166、聚類自我引導合作

如果一個空節點的鄰居包括了一個合作者(其度數為D且有K個作為合作者的鄰居),同時這個空節點的所有非合作者鄰居都沒有合作者的鄰居,那么這個空節點會成為一個合作者,當且僅當合作優勢比例高于與合作者數量之間的比例時

167、集體行動問題

在集體行動問題中,N個人中的每個人都要選擇是搭便車(f)還是為集體行動做貢獻(c)。個人的收益取決于自己的行動和合作者的總數。個人可以通過搭便車獲得更高的收益,即,收益(f,C)>收益(c,C+1),但是當每個人都做出貢獻時,所有人的收益總和實現最大化

168、公共物品供應問題

有N個人,每人要將自己的收入I(I>N)配置到一種公共物品(PUBLIC)和一種私人物品(PRIVATE)上,每個單位的成本為1美元。每個人都有以下形式的效用函數:

效用[插圖]

社會最優配置:PUBLIC=N(如果N=100,那么每個人捐獻100美元)。

均衡配置:PUBLIC=1/N(如果N=100,每個人捐獻0.01美元)

169、利他主義者提供的公共物品

N人有利他主義偏好,其對總效用的權重為α:

[插圖]

均衡純粹的利他主義者(α=1):PUBLIC=N

均衡一般解:6[插圖]

實例:α=1/2:PUBLIC≈N/4

170、對于這種本地公共產品,人們可以根據自己的偏好將它們歸入不同的社區。這就是所謂的蒂布特模型

171、擁塞模型

在N人中,M人選擇使用一種資源。其效用可以寫成如下形式:

效用(M)=B-θ×M

B表示最大收益,θ是擁塞參數。其余(N-M)人不使用這種資源,并且效用為零。9

社會最優解:[插圖],且效用[插圖]

納什均衡解:[插圖],且效用[插圖]

172、當一個模型產生的結果與常識相反時,就需要對結果細加思量

173、可再生資源開采模型

令R(t)表示第t期開始時的可再生資源數量,再令C(t)表示第t期內耗用的資源的總量,g表示資源的增長率。那么,第t+1期的資源數量量由以下差分方程給出:11

R(t)=(1+g)[R(t)-C(t)]

均衡消費水平:[插圖]

174、能夠有效解決集體行動問題的那些社群有如下共同特點:能夠就某些明確的界限達成一致、同意明確界定的規則、授權實施漸進式制裁、擁有解決糾紛的機制

175、任何一個制度都要包括兩個因素:一是人們用來交流信息的渠道,二是人們用來根據所揭示的信息做出決策、重新配置資源或安排生產的程序

176、機制設計(mechanism design)的對制度進行建模的框架。這個框架強調了真實制度的如下四個方面:信息,指參與者知道些什么及應該向他們揭示什么;激勵,即采取特定行動的利益和成本;集結,個人行為如何轉化為集體結果;計算量,這是對參與者認知能力的要求

177、一種機制由六個部分組成:一個環境(世界的相關特征)、一個結果集、一個行動集(也稱為消息空間),一個行為規則(人們根據這個規則來做出行動)、將行動映射到結果的結果函數,以及將環境映射到一組希望得到的結果的社會選擇對應

178、帕累托有效

在一個結果集中,對于某個結果,如果存在每個人都喜歡的另一個備選方案,就說這個結果是帕累托占優的。相對應,所有其他結果都是帕累托有效的

179、收入等價定理

在任何拍賣中,如果競買人從已知的共同分布中抽取獨立私人價值,那么只要滿足如下條件,拍賣就必定會給賣方帶來同樣的收入、給買方產生同樣的預期收益:每個競買人的出價都是為了最大化自己的預期收益、最高出價的競買人總能贏得拍賣標的,同時價值為零的競買人的預期收益為零

180、公共項目決策問題

V1,V2,…,VN表示N個人賦予一個公共項目的貨幣價值,并假設該公共項目的成本為C。那么當且僅當C<V1+V2+…+VN時,這個項目才會啟動

181、多數投票平均分擔機制

個人投票表示贊成或反對啟動某個公共項目。如果多數人投票支持該項目,那么該項目啟動,并且每個人都承擔C/N的成本。如下面的例子所表明的,這種機制可能會違背效率條件和自愿參與原則

182、樞軸機制

個人i對一個成本為C的項目提交自己的估值[插圖]。如果所有個人的值的總和超過了成本,那么就啟動這個公共項目,即:

[插圖]

如果[插圖],那么個人i不用交稅;如若不然,個人i就要繳納數額為[插圖]的稅收。這個機制是激勵相容的[插圖]、有效率的,而且個人行為也是符合理性。它還實現了占優策略的有效結果。但是,正如下面的例子所表明的,這個機制可能會違背預算平衡條件。

實例:(V1,V2,V3)=(60,120,150),C=300。

這個公共項目本應啟動,因為300<60+120+150。個體1要繳納的稅收為30,即總成本減去其他人估值之和的結果(300-270);個體2要繳納的稅款為90;個體3要繳納的稅款為120。由此得到的總稅收為240,低于項目的成本

183、離散信號模型

一個規模為N的種群由S個強者類型的個體和W個弱者類型的個體組成;這兩種類型的個體發送信號的成本分別為c和C,且c<C。種群中所有發送信號的成員平均分配B的收益(B>0)。這個模型有三種可能的結果:

混同[插圖]:兩種類型的個體都發送信號。

分離[插圖],且[插圖]:只有“強者”類型的個體發送信號。

部分混同[插圖]:“強者”類型的所有個體和“弱者”類型的部分個體發送信號

184、連續信號模型

一個規模為N的種群由S個強者類型的個體和W個弱者類型的個體組成,兩種類型的個體發送信號的單位成本分別為c和C(C>c)。發送最大信號的所有個體分享利益B。任何大小為[插圖]的信號都能夠將強者類型分離開來。如果CW≥cN,那么所有強者類型都會分離開來。如若不然,就存在部分混同均衡,其中一部分弱者類型的個體也會發送信號

185、強化學習模型

假設一個由N個備選方案組成的集合{A,B,C,D,…,N}、與各備選方案對應的獎勵的集合{π(A),π(B),π(C),π(D),…,π(N)},以及一個嚴格為正的權重的集合{w(A),w(B),w(C),w(D),…,w(N)}。那么,選擇備選方案K的概率如下:

[插圖]

在選中了備選方案K之后,w(K)會增大γ×P(K)×(π(K)-A),其中γ>0等于調整速率(rate of adjustment),A<maxKπ(K)等于渴望水平

186、強化學習的效果

在學會選擇最優備選方案模型的框架中,當渴望水平被設定為等于平均獲得的獎勵時,強化學習(最終)幾乎總是會選擇最優備選方案

187、復制者動態

假設一個由N個備選方案組成的集合{A,B,C,D,…,N}、與各備選方案對應的獎勵的集合{π(A),π(B),π(C),π(D),…,π(N)}。在時間t,一個種群的行動可以用這N個備選方案上的概率分布來描述:(Pt(A),Pt(B),…,Pt(N))。且這個概率分布隨如下復制者動態方程而變化:

[插圖]

其中,[插圖]等于第t期中的平均獎勵。

188、復制者動態能夠學會最優行動

在學會從一個有限的備選方案集中選擇最好的備選方案的過程,無限種群復制者動態幾乎總是收斂到整個種群都選擇最優備選方案

189、居心險惡的人與魔法燈

在一次考古探險中,一個居心險惡的人發現了一盞青銅燈。他擦了一下燈,結果召喚出了一個精靈。精靈說:“我會賜予你一個愿望,因為我是一個仁慈的精靈。我可以給你想要的任何東西!不但如此,對于你認識的每一個人,我都將給予他們給你的兩倍。”這個居心險惡的男人仔細想了一會,然后抓起了一根棍子,遞給那個精靈,說:“好吧。現在請你摳出我的一只眼睛吧

190、慷慨/妒忌博弈

在這個博弈中,有N個博弈參與者,每一個博弈參與者都要選擇:是慷慨(G),還是妒忌(S)。

收益(G,NG)=1+2×NG

收益(S,NG)=2+2×NG

191、文化能否壓倒戰略

我們現在將傳染模型和學習模型結合起來,以便剖析組織理論中由來已久的一個理論觀點:文化壓倒戰略。16簡而言之,這個觀點聲稱,改變行為的戰略激勵終將歸于失敗。理論組織家強調,文化——即現有的既定規則和信念的力量實在太強大了。經濟學家的觀點則相反:推動行為的,只能是激勵。

為了將這些相對立的諺語式診斷轉變成條件邏輯判斷,我們首先必須應用網絡傳染模型的一個變體。在這個模型中,經理,或者也可能是CEO,宣布了一個新戰略,并給出了推動變革所能帶來的好處的多項證據。這位經理或CEO甚至可能會對組織的核心原則加以重新界定,以便反映這種新行為的要求。然后,組織中的其他個體決定是否采取這種行為,這取決于經理或CEO對其戰略的說服力有多大。一開始,只有一部分人執行這個計劃。當他們在工作網絡中與他人互動時,就會熱情洋溢地傳播新戰略。當然新戰略也會面臨挑戰,會有一種反向的力量拉動人們不去采用新戰略。有三個特征決定了新策略能否順利展開:接觸率(Pcontact)、擴散率(Pspread)和放棄率(Precover),它們很自然地映射到了基本再生數中的參數R0上,即:

[插圖]

如果再加入存在超級傳播者的可能性,就可以得出這樣的結論:只要如下三個條件中任何一個條件成立,文化就會壓倒戰略,否則,戰略就能壓倒文化。這三個條件分別是:如果人們不相信新戰略,如果人們很快就放棄了新戰略,如果新戰略的擁護者相互之間的連通性不夠好。

我們的第二個模型是,將復制者動態方程應用于這個用來表征員工之間互動的文化戰略博弈。我們可以將員工的不同選擇用博弈論的語言分別表示為文化行動(做他們目前所做的事情)和創新的戰略行動。我們還假設,經理或CEO已經確定了收益結構,如果兩個博弈參與者都選擇創新的話,他們都能獲得更高的收益;但是,如果只有一個博弈參與者選擇創新,那么他的收益將會減少。

[插圖]

文化/戰略博弈

這個博弈有兩個嚴格的純策略納什均衡:一個是兩個博弈參與者都創新(戰略勝過了文化),另一個是兩個博弈參與者都不創新(文化勝過了戰略)。乍一看,經理或CEO似乎已經給出了足夠大的激勵,能夠保證員工會選擇創新的行動。但是通過分析,我們發現,經理或CEO必須動員起足夠多的初始支持者才能使創新成為現實。如果一開始就支持新戰略的人的比例沒有超過20%,那么文化就會勝過戰略。如果要增加創新戰略的收益,那初始支持者的比例可能會更低,但仍然會產生有效的結果。17

這兩個模型表明,字面上相反的兩個諺語“文化壓倒戰略”和“人們會對激勵做出反應”都是正確的。根據第一種模型,具有很高人格魅力的CEO可以制訂能夠勝過文化的新戰略。根據第二種模型,文化能勝過“弱激勵”,但是不能勝過“強激勵”

192、伯努利多臂老虎機問題

一個備選方案集{A,B,C,D,…,N}中的每一個備選方案都能夠產生一個成功的結果,但是各自的概率{PA,PB,PC,PD,…,PN}都是未知的。在每一個時期,決策者選擇一個備選方案K,并以概率PK得到一個成功的結果

193、取樣并擇優啟發式(sample-then-greedy),即先對每個備選方案都嘗試固定的次數M,然后選擇具有最高平均收益的備選方案。而在確定嘗試次數M大小的時候,我們可以參考伯努利甕模型和平方根規則。平均比例的標準差有一個上界[插圖]。如果每種備選方案都進行了100次的測試,那么平均比例的標準差將等于5%。如果應用兩個標準差規則來識別顯著差異,當兩個比例相差大約10%時,我們就能夠自信地將它們區分開來了。例如,如果一個備選方案在70%的時間內都取得了成功的結果,而另一種方法則只在50%的時間內取得了成功,那么就有95%以上的置信水平相信我們能夠選中正確的備選方案。

第二種啟發式稱為自適應探測率啟發式(adaptive exploration rate heuristic)。它的程序是,第一階段,先讓每種備選方案各完成10次試驗。第二階段,再進行總共20次試驗,但是試驗次數根據各備選方案在第一階段的成功率按比例分配

194、貝葉斯多臂老虎機問題

給定備選方案集{A,B,C,D,…,N},以及對應的收益分布{f(A),f(B),f(C),f(D),…,f(N)}。決策者對每個分布都有先驗信念。在每一期,決策者選擇一個備選方案,并獲得收益,并根據收益計算出新的信念

195、要確定最優行動,需要經過如下四個步驟。首先,要計算出每個備選方案的即時期望收益。其次,對于每個備選方案,都要更新關于收益分布的信念。再次,在得到的關于收益分布的新信念的基礎上,根據我們所掌握的信息確定所有后續時期的最優行動。最后,我們將下一期行動的期望收益與未來的最優行動的期望收益相加

196、吉廷斯指數

為了說明如何計算吉廷斯指數,考慮下面這個只有兩個備選方案的例子。備選方案A產生的收益抽取自{0,80},且0和80出現的概率相等。備選方案B在{0,60,120}當中產生一定的收益,而且這三個收益的概率也是相等的。我們假設,決策者試圖最大化10個時期內的總獎勵。

備選方案A:收益等于零的概率為1/2,在出現了這種結果之后,在剩下的全部9期內都會選擇備選方案B(備選方案B的期望收益60),這樣就得到了540的期望收益(9乘以60)。收益等于80的概率也為1/2,即便出現了這個結果,在第二期的最優選擇仍然是選擇備選方案B。于是有1/3的概率,備選方案B產生了120的收益,因此總收益等于1160(80加上9乘以120)。同樣,有1/3的概率,備選方案B產生了60的收益,在這種情況下,備選方案A是剩下的所有8期的最優選擇,這樣產生的總收益等于780(60加上9乘以80)。最后,還有1/3的概率,備選方案B產生了零的收益,在這種情況下,備選方案A是剩下的所有8期的最優選擇,這樣產生的總收益等于720(9乘以80)。

把上面這些可能性全都考慮進去,可以得出,在第一期,備選方案A的吉廷斯指數如下:

[插圖]

備選方案B:有1/3的概率,收益等于120。如果發生了這種情況,那么所有未來時期的最優選擇也仍然是備選方案B。因而10個時期的總收益將等于1200。如果收益等于零(概率為1/3),那么所有未來時期的最優選擇都將是備選方案A(備選方案A的期望收益為40),因而,期望總收益將等于360(9乘以40)。如果收益等于60,那么決策者在所有未來時期都應該選擇替代方案B,總回報為600;但是,如果在第二個時期選擇了備選方案A,那么有一半時間備選方案A總是產生80的收益,此時總回報為780(60加上9乘以80);另一半時間它產生零收益,并且所有后續時期的最優選擇都將是備選方案B(會產生60的收益),于是得到的總收益為540(9乘60)。由此可知,在第二期中選擇備選方案A才是最優選擇,這種選擇產生的期望收益等于660×(1/2×780+1/2×540)。

把所有可能性都考慮進去,不難推出,備選方案B在第一期中的吉廷斯指數如下:

[插圖]

根據這些計算結果,備選方案B是第一期的最優選擇。最優長期選擇則取決于第一期內學習的結果。如果備選方案B產生了120的結果,那么我們將永遠堅持選擇備選方案B。

上述的分析表明,在采取行動時,我們更關心的是備選方案能夠成為最優選擇的概率而不是它的期望收益。此外,如果某個備選方案會產生非常高的收益,我們應該更有可能在將來選擇它。相反,如果它只能產生平均收益,那么即便收益水平高于另一種備選方案的期望收益,我們一直堅持這個備選方案的可能性也不會太高。在嘗試的早期階段尤其如此,因為我們希望找到更高收益的備選方案。這些結果在我們討論的諸多應用中都是成立的。如果采取行動沒有風險,也不需要付出高額成本,那么這個模型告訴我們,即使高收益行動的概率很低,我們也要努力去探索它們

197、空間競爭模型:民主、共和兩黨的總統候選人在意識形態空間中互相競爭以吸引選民。我們有理由預計,各候選人傾向于溫和的中間立場、選情會比較膠著,不同政黨候選人獲勝的順序是隨機的。除了少數例外情況外,總統選舉不會以某一方壓倒多數獲勝結束。為了檢驗美國總統大選獲勝者的順序是不是隨機的,我們構建了從1868年到2016年38次總統大選的獲勝政黨的時間序列。該序列如下(字母R、D分別表示共和黨、民主黨):

RRRRDRDRRRRDDRRRDDDDDRRDDRRDRRRDDRRDDR

然后我們可以計算出不同長度的子序列(塊)的熵。長度為1的子序列的熵為0.98。長度為4的子序列的熵為3.61。統計檢驗表明,我們不能否認這個序列是隨機的。作為比較,在長度為38的隨機序列中,長度為1的子序列的熵為1.0,長度為4的子序列的熵為3.58。

198、分類模型:如果我們將每個州視為一個類別,同時假設不同州之間存在著異質性,那么空間競爭模型意味著一旦候選人選定了初始位置,某些州就不再具有競爭力了。這個模型的預測是,在少數幾個立場溫和的州,選舉競爭將特別激烈。2012年,奧巴馬和羅姆尼都在10個州花掉了自己電視廣告預算的96%以上。他們每個人都將廣告預算的一半多用于3個溫和的州:佛羅里達州、弗吉尼亞州和俄亥俄州。2016年,希拉里·克林頓和特朗普也將一半以上的電視廣告預算花在了3個溫和的州:佛羅里達州、俄亥俄州和北卡羅來納州。7

多臂老虎機問題的模型(回溯性投票):選民將更有可能將選票再一次投給有良好執政業績的那個政黨。給績效好的政黨投票,相當于拉一個會帶來高收益的杠桿。經濟繁榮通常會使競選連任者受益。有證據表明,當經濟表現良好時,選民更有可能投票給執政黨的候選人。而且,在執政黨內部,現任候選人的影響也大于非現任候選人

199、分類模型:如果我們將每個州視為一個類別,同時假設不同州之間存在著異質性,那么空間競爭模型意味著一旦候選人選定了初始位置,某些州就不再具有競爭力了。這個模型的預測是,在少數幾個立場溫和的州,選舉競爭將特別激烈。2012年,奧巴馬和羅姆尼都在10個州花掉了自己電視廣告預算的96%以上。他們每個人都將廣告預算的一半多用于3個溫和的州:佛羅里達州、弗吉尼亞州和俄亥俄州。2016年,希拉里·克林頓和特朗普也將一半以上的電視廣告預算花在了3個溫和的州:佛羅里達州、俄亥俄州和北卡羅來納州。7

多臂老虎機問題的模型(回溯性投票):選民將更有可能將選票再一次投給有良好執政業績的那個政黨。給績效好的政黨投票,相當于拉一個會帶來高收益的杠桿。經濟繁榮通常會使競選連任者受益。有證據表明,當經濟表現良好時,選民更有可能投票給執政黨的候選人。而且,在執政黨內部,現任候選人的影響也大于非現任候選人

200、表示為一個長度為N的二進制字符串,這就是NK模型中“N”的含義。至于“K”,則指與該字符串的每一位交互以確定這一位的值的其他位的數量。如果K等于零,那么價值函數就是線性的。如果K等于N-1,則所有的位都相互交互,每個字符串的值都是隨機的

201、NK模型

一個對象由N位二進制符號組成,s∈{0,1}N。

這個對象的價值表示為V(s)=Vk1(s1,{s1k})+Vk2(s2,{s2k})+…+Vk1(s1,{s2k}),其中,{sik}等于一個從原字符串中除了第i位之外隨機選擇出來的有k位的子字符串的集合,而且Vk1(s1,{s1k})是從區間[0,1]中抽取出來的一個隨機數。

K=0:得到的是一個關于位的線性函數。

K=N-1:任何位的變化都使每個位產生新的隨機貢獻

202、NK模型的一個重要含義是,我們需要適度的相互依賴性,因為這種互動能夠產生更高的峰值

203、技術和人力資本模型——增長模型

產出取決于實物資本(K)、受過教育的人的勞動(S)和未受過教育的人的勞動(U),具體生產函數如下:

產出=AKαSβUγ

參數A、α、β和γ刻畫了技術和三種投入要素相對價值。高技能工人和低技能工人的相對市場工資是:7

[插圖]

(Wages是高技能工人的工資,Wages是低技能工人的工資)

不平等的原因:有利于受過教育的工人的技術變革會使β增大、使γ減少。這一點,再加上低技能工人供給的增加,會增加不平等

204、對才華的正反饋——優先連接模型

存在N個生產者。開始時,每個生產者的銷量均為零。第一個消費者隨機選中了一個零銷量的生產者,購買了產品,使該生產商的銷量為正。隨后,每個后續消費者都以概率p從銷量為零的生產者那里購買、以概率(1-p)從具有銷量為正的生產者那里購買。當從具有銷量為正的生產者那里購買時,消費者選擇生產者的概率與該生產者的當前銷量成正比例。

不平等的原因:更多的聯系增加了社會影響,創造了正反饋

205、CEO的薪酬——空間投票模型

CEO薪酬由薪酬委員會投票決定。在美國,薪酬委員會通常由現任和前任CEO(他們當然更喜歡高薪)以及薪酬專家(X)組成。而在其他國家,薪酬委員會的組成人員中還有工人(W),因而導致中間選民更偏好比較低的薪酬水平。

[插圖]

不平等的原因:CEO通過相互“俘獲”來確定自己的薪酬。任何一位CEO的薪酬的增加,都會使所有CEO更加偏好更高的薪酬

206、資本租金模型(皮凱蒂)——72法則

經濟由工人和資本家組成。工人的工資增長率為g,即經濟增長率。資本家在時間t有財富Wt。資本的回報率為r(稅后凈額),且資本家的消費為一個不變的常數A。資本家的收入將比工人的增長更快,當且僅當:

[插圖]

不平等的原因:在市場經濟中,資本回報率必定超過經濟總增長率(即r>g)。擁有大量財富的資本家只將自己資本收入的一小部分用于消費,因此他們在總收入中的份額將隨著時間的推移而不斷提高

207、選擇性婚配模型——分類模型與分類

每個人都有自己的教育水平:{1,2,3,4,5}。(其中1=輟學,2=高中畢業,3=上過大學,4=大學學位,5=研究生)

令P(m,j)和P(w,j)分別表示男人和女人具有教育水平j的概率。收入(g,?)表示性別為g、收入水平為?的人的(估計)收入。一對夫婦組成的家庭的收入,包括了一個受教育程度為?M的男子和一名受教育程度為?w的婦女的收入。其家庭收入估計如下:12

收入(M,?M)+收入(W,?w)

不平等的原因:受過良好教育的女性人數的增加、高教育水平的工人工資的增加,以及選擇性婚配(人們喜歡與收入水平相同的異性結婚的傾向)導致了家庭之間收入不平等的增加

208、代際收入(財富)動態變化——馬爾可夫模型

將所有人口劃分為4個人數相等的收入(或財富)類別。我們可以估計一個類別中的個體(或家庭)在一代的時間內流動到另一個類別中的轉移概率(如下圖所示)。更平等的轉移概率對應更大的社會流動性。

[插圖]

收入水平(收入等級)之間的轉移概率

不平等的原因:社交技能、隱性知識、對風險和教育的態度以及遺產,減少了收入階層之間的流動性

209、持續不平等(杜魯夫)模型——謝林隔離模型+局部多數模型

所有個人分別屬于不同收入類別,并按不同收入類別分離居住。個人將自己的部分收入用于教育,從而產生正面的溢出效應,這種溢出效應隨社區收入水平的上升而增強。生活在社區C中的孩子的未來收入取決于自己天生的能力、教育支出和溢出效應。教育支出和溢出效應的貢獻取決于這個社區的收入水平,IC。

個人收入C=F(能力、教育支出(IC)、溢出效應(IC))

不平等的原因:在低收入社區長大的兒童獲得的教育機會較少、受益于經濟溢出效應的可能性也更低

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。