盡管塔勒布在第二部分就說這本書的核心思想已經結束了,讀者對理論基礎不感冒的話可以直接跳到簡短的第四部分結束,但他卻花了幾乎一半的篇幅做理論分析。整個第三部分全部都是數學,概率,統計的原理和概念。做為一個喜歡搞清原理的人也是花了絕大部分時間研究第三部分,今天專門針對理論部分寫一寫。
首先回答我自己昨天提出來的疑惑:
1.為什么大家都說黑天鵝是肥尾事件,而塔勒布在后記里面說這個標簽不對?那黑天鵝到底是不是肥尾?還是灰天鵝是肥尾?兩個概念很模糊。我可能需要在英文原版里面找答案。
我的理解:網上說的黑天鵝是肥尾是不準確的。黑天鵝無法預測,是Unknown unknowns, 它也無法在一個有形的冪率分布曲線上面顯示出來,因為你根本無法確定冪函數的指數常數是多少。那些可以模糊地根據數學模型(類似分形分布)預測到的某一些看起來像是黑天鵝,可能應該最多算是灰天鵝。
2. 我之前對正太分布(高斯分布)的應用理解應該是有偏差的,在這本書里被澄清了一部分,但同時讓我懷疑看過的其他書的理論,需要求證和批判思維。
我的理解: 通過深入地閱讀第三部分,高斯分布的應用適合在有限的范圍內,最大和最小值都不會偏離中心/平均值太多的場景,比如,人的身高(不可能出現超級極端的身高),投硬幣,賭博等相對比較容易預測的概率事件,它是連續(xù)的獨立隨機事件的概率分布,遵循大數定律,屬于平均斯坦的理論模型;但它不適用于真實的經濟投資領域,因為現實是跳躍的,不對稱的,多樣化的,不可預測且容易出現極端事件,屬于極端斯坦,呈冪律分布(power law distribution)的事件。
3. 分形分布的概念在這里和冪律分布有什么差別?為什么作者不是直接引用冪律分布而是要把自己老師命名的隨機性加起來(曼德爾布羅特隨機性)?
我的理解:分形分布遵守冪律分布的特征,是其中一種表現形式。我猜測作者引用了分形分布的發(fā)明者(曼德爾布羅特)的理論,第一最重要的原因是由于分形分布沒法預計上限,更符合出現黑天鵝事件的領域特征(比如說財富,投資回報等等):二是分形分布的分形維度較容易和冪律分布的指數聯系起來,便于理解;三是因為分行分布比統計原理好理解,因為它是有幾何圖形衍生出來的,容易聯想;四當然是因為作者敬佩曼德爾布羅特了,分形幾何的發(fā)明確實非常偉大,有著非常廣泛的影響,不僅是數學,藝術,建筑,統計還有醫(yī)學(據說肺也具有分形特征)。
作者第三章的核心思想就是:高斯分布不適用于預測經濟領域的隨機事件,尤其是黑天鵝事件。具有極端的不確定性,不對稱性(微小的輸入可以導致巨大的輸出/影響)的黑天鵝事件無法預測。分形分布(遵循冪律分布定律)可以幫助我們分辨某些“中度極端”的黑天鵝,作者稱之為“灰天鵝”,因為沒有任何人可以精確預測到黑天鵝,那些真正的難以捕捉的事件。
作者花了非常大的篇幅把高斯分布給徹頭徹尾地解釋了一遍,從高斯數學模型高爾頓發(fā)明的梅花機解釋開來,關于高斯定律的標準差和大數定律,以此來告訴我們,高斯分布不適用于現實的經濟投資領域。因為高斯分布不涉及超級的跳躍,不連續(xù)的事件和這些事件可能帶來的影響。運用高斯定律來分析市場的隨機性,就像聚焦在小草上面而忘記了參天大樹。雖然極端事件概率非常小 ,但是帶來的影響卻是巨大的。
作者通過舉例兩位諾貝爾經濟學獲獎者執(zhí)掌的基金公司長期資本投資管理公司,運用高斯定律形成的投資策略在98年經濟危機的時候幾乎破產。Robert Merton和Myron Scholes基于高斯分布的理論看起來完美無暇,但他們卻忽略了小概率的黑天鵝事件。作者稱高斯分布是The great intellectual fraud.(顯然作為數學定律來說,高斯沒啥毛病,還是用的人有問題)
世界是不公平的。我們熟悉的馬太效應,80/20定律(帕累托法則),還有Zipf法則都說明了,這個世界上沒有公平而言(帕累托法則,zipf都是符合冪律分布的)。我們生活的現實世界更像是在極端斯坦。運氣比起智慧來說,可能是更公平的,因為在極端斯坦,沒有人可以永遠處于不敗之地。當然好消息是,在極端斯坦,也沒有人會完全的絕跡。這個科學依據是根據冪律分布的長尾特征總結的。可以想象大多數財富集中在少數人手里(head class),少數財富集中在多數人手里(Long tail class)。但同時這個狀態(tài)也不是固定的,每過一段時間就有頭部企業(yè)消逝,小企業(yè)迅速擴張取而代之,所以在極端斯坦,我們只需要確保我們能在場上,就有希望。(盡管概率很小,想想出現獨角獸的概率是多少??)
分形分布是作者單獨提出來的一個重要的概念。
美國數學家Mandelbrot1967年在Science上發(fā)表了著名的文章《英國海岸線有多長》(how Long Is The Coast Of Britain),從此使“分形”的概念變得十分流行。什么是分形呢?簡單地說,就是說自然中存在的線、面、體,并不像古希臘人和歐氏幾何期望的那樣是光滑平整的,而是“坑坑洼洼”的。Mandelbrot有一句名言:“云彩不是球體,山嶺不是錐體,海岸線不是圓周,樹皮并不光滑,閃電更不是沿著直線傳播的。”
分形圖形的基本特征是具有標度不變性。 即在使用不同的尺度下觀測分形圖形時所得到的結果是具有相似性的,分形圖形具有尺度上的對稱性。 這種特性表明,不同的尺度(大小)的同一種分形圖形之間具有某個共同的幾何參數,即這一參數是一個與尺度大小無關的不變量,這個量就是分形集合中的分數維。
簡單來說,分數維的數學特征符合冪律函數的數學特征,因此說分形分布是冪律分布的一種表現形式。如上文所說,分形分布的特征是非常符合黑天鵝事件出現的領域的。
實際上, 冪律分布廣泛存在于物理學,地球與行星科學,生物學,人口統計學,經濟學等眾多領域中。很多大自然的底層現象都屬于冪律分布的范疇。
為什么我們不能精準預測黑天鵝?因為如果事件符合分形分布,就可能會有非常大的數值產生,這使得大的偏差就會有可能出現,但是多大的可能性,多久會發(fā)生一次,無從預測。這里我理解就是“分數維”(也就是冪律函數的指數)是個模糊的,無法精準預測,因此你不可能得到一個百分百的答案。你可能最大機會得到一個“灰天鵝”出現的范圍而已。
篇幅有限,只能把重要概念提取總結。真的要深入研究的話,高中數學估計要重新學一遍。這種情況,聚焦在問題的影響層面好過把自己逼死在學習科學理論上。
明天來講講最重要的第二部分。