讀《概率統計超入門》及《萬萬沒想到之最簡單概率論的五個智慧》

《概率統計超入門》是我在網上淘書時,發現的已絕版的原版拓印版。這本書是2001年日本的兩位教育家寫的,和《給討厭數學的人——數學的奧妙與生活》一樣,都是在日本教育部進行一次大的基礎教育改革,推行“愉快教育”旗號時推出的。所不同的是,前者發揚了愉快教育的精神,真的把枯燥難懂的概率學寫得非常淺顯易懂,而后者則是擔憂民眾從此失去對數理的興趣,遠離真知而寫的一本科普書。在此感慨一下日本教育界大家的寫作功底,和實踐自己理念的精神。

《概率統計超入門》除了由淺入深、結合日常實例等特點外,給人最大印象的是每一節內容都是兩頁。這讓沒有很大動力學習的人也能很輕松的持續看下去,就好比想鍛煉的人應該從每天做一個俯臥撐開始,而不是上來就做二三十個。?“循序漸進、持之以恒”在大多數情況下都是一個好原則。

書中講的東西都很淺顯,把有關概念和公示抄錄下來,在筆記本上?也只有6頁。把概念都羅列出來,分別有重復隨機試驗的二項式分布公式、期望值、方差、標準差、散布度、契貝曉夫定理(又稱切貝雪夫定理,這一節百度了三天才看懂)、協方差、相關系數、線性回歸、多個隨機變量的期望值、方差的和差積的計算,二項式分布的期望值和方差、超幾何分布。這些名詞看起來很專業,其實平均每一個都只需要花5分鐘就能理解??催@本書時和印象中的中學概率統計有很多不同,感覺這本書的內容更側重實用,更像是數據分析的基礎入門教材。

其實如何計算概率和隨機變量的屬性及相關性,對不打算從事金融、商務分析、人工智能這些行業的人來說并不重要,但是理解概率的概念,擁有概率統計的思維卻是非常重要的一件事。萬維剛在《萬萬沒想到》中甚至說,概率論是比萬有引力和基因復制更重要的知識,是?現代公民的必備常識,有沒有這種思維,直接決定一個人的“開化”程度。這個話雖然聽起來有些危言聳聽,但事實確實如此。概率論的重要性主要體現在經濟學的相關領域里,說白了就是跟錢有很大關系。相信每一個從不懂到看懂概率論的人都會感慨:“要是早點學就好了”。概率論的思維最大的用處,就是可以讓我們避開社會上的一些“坑”,以保護好自己的財產,避免繳納“智商稅”。

簡單記錄一下《萬萬沒想到》中關于概率的這篇文章《最簡單概率論的五個智慧》。

第一個智慧:隨機。概率論最基礎的思想是,有些事是無緣無故發生的,這就是隨機的概念。我們總是習慣性的把一件事情的發生,歸結為各種原因。【現代認知科學發現,因果關系是人類認識外界的基本機制,失去邏輯人類的認知系統就會崩潰。這就為認識隨機性造成了難度,其實在隨機性背后還有一個更深的哲學理論,叫非連續性?!?比如考試考的好,可以理解為學習用功了;比賽失敗,可以理解為實力不濟或者球員不在狀態。但是并非任何時候事物都是必然的,偶然性也會造成很大影響。最極端的就是彩票:在同一期里買了相同數量彩票的人,中獎的概率是一樣的,無論你在之前做過多少努力,比如研究彩票走勢、沐浴更衣、燒香拜佛還是積善行德,都不會影響中獎的真實概率。像彩票這樣的叫做獨立的、隨機的事件,它們的發生沒有任何緣由,跟任何事物都沒有因果關系。生活中絕大多數事情是偶然和必然的結合,我們在努力掌握必然性的同時,也應該認識到偶然性的存在,不應該把過多的精力花在尋求偶然因素上面。比較重要的一點啟示是,在評判一個人時,不應該用一時的好壞或成敗來給他貼標簽(西方社會直接有“do not judge”不要評判一個人的文化);在尋找成功方法時,更要分清楚別人的成功里存在哪些必然和偶然因素,避免盲目尊崇和不以為然,更加理性的看待事物。

第二個智慧:誤差。偶然性永遠存在,哪怕在極度嚴謹的物理實驗中,也無法保證完全沒有偶然影響,而只能通過多次實驗取平均值的方法,用范圍值來表示實驗結果,盡量降低偶然因素的影響。即便如此,實驗結果也并不代表真實的值就一定在標明的范圍里面,其實這個范圍也只是在概率上的計算結果而已,只能說明真實值落在范圍外面的可能性很小。誤差不可避免,通過多次試驗、或者多組數據來考量必然性與偶然性,是一個很重要的科學思維。比如世界杯預選賽時,國足總是在失敗以后強調客觀因素,這些客觀因素確實是影響結果的偶然因素,但多次失敗以后,我們還是可以得出國足是一支弱隊的結論。

第三個智慧:賭徒謬誤。從這里就開始教大家識別“坑”了。所謂的賭徒謬誤,就是賭徒在賭博時,如果多次出現某一種情況,那他就認為沒有出現過的情況在后面出現的幾率會更大。比如扔色子時,已經好幾次“大”了,那他就認為后面應該壓“小”。這種思維是絕大多數人的習慣思維,也是人的本能思維。因為人腦的機制就是認為萬事萬物都有聯系,(有趣的是,小孩子認為萬物有靈,任何東西都是有生命的,比如汽車要加油了,他們會認為汽車開的累了要休息。所以人的天性里存在因果關系。)?只有通過習得抽象概念才能跳出這個偏誤。賭徒謬誤的錯誤在于,他們認為概率是平均分布的,前面少的后面就會補回來。他們沒有理解“獨立”和“隨機”這兩個概念。所謂“獨立”,就是前后兩次事件之間沒有任何關聯,每一次發生的概率都是一樣的。“隨機”則是單獨一次事件發生的可能性在理論上是等于概率的,但真的會不會發生是沒法預測的。概率統計中有一個“大數定律”,大數定律確實說概率是均勻分布的,但有個前提是實驗次數要足夠多。所謂足夠多就是無限多,幾百幾千幾萬次都稱不上足夠多,幾萬次以后的結果也只是“接近概率分布”。因此大數定律是一個理論情況,它的含義是前面如果已經扔出了很多次“大”,那再扔很多很多次以后,會出現非常多的“大”和非常多的“小”,以至于前面出現的幾次“大”被忽略不計了。

第四個智慧:不由自主的找規律(原文是在沒有規律的地方發現規律)?。概率論的核心在于,獨立隨機事件的發生是沒有規律和不可預測的。我們沒有必要為偶然發生的事情過于在意,也不應該試圖在隨機中尋找規律。彩票分析學大行其道了很多年,大街小巷的彩票售賣店里都會有過去開獎的趨勢圖,各大網站也都有所謂的彩票分析專家,預測未來的彩票走勢。在有概率思維的人看來,想要預測彩票走勢是一件非??尚Φ氖虑椋@跟預測股票走勢本質上是不同的,因為彩票沒有任何外界因素可以考量,是一個純粹的獨立隨機事件。賭徒謬誤的問題在于分不清大數和小數的區別,彩票分析學的問題則在于,人們認為彩票存在走勢,即規律。其實,發現規律也是人的一種天性和本能,人無時無刻不在把外界的信息總結成一些抽象的規律以便記憶,人腦在這方面的強大,以至于會讓人只看到自己想看的東西,忽視不想看和不想知道的東西,如果有不符合規律的情況,就會被歸結為“意外”,甚至是方法不對、只可意會、個人修行之類玄而又玄的原因,(這是一個很有用的心理常識,比如人永遠喜歡奉承自己的話,哪怕非常清楚對方只是在奉承自己,而總是不喜歡聽到反對自己的意見,哪怕明知道對方出于好意。)這是主觀上的原因??陀^的原因是,如果數據量足夠多,總是能找出一個看起來合理的規律,就好比天上飄著的云,我們總是能找出一片云像某種物體,還越看越逼真。

第五個智慧:小數定律。數據多的時候規律總是會被找到,而當數據少的時候,規律有時候會自己“跳出來”。隨機現象可以看上去很不隨機,甚至非常整齊。這個很好理解,兩個點連成一條直線,你可以說這兩個點就在這條直線上;三個點則必然會有一個三角形;四個點......永遠都能有一個自洽的結論,說明幾個點構成一個圖形,但實際上點在不在圖形上,沒有相關性,也就是因果關系。小數定律是諾貝爾經濟學獎丹尼爾.卡尼曼戲稱的,他認為理解小數定律和理解大數定律是相輔相成的。這跟前面的賭徒謬誤的意思差不多,在生活中是最容易被忽視而造成可笑錯誤。比如,你曾經被河南人騙過,又恰好聽說自己的一個朋友被河南人騙過,如果你進一步在網上發現有人被河南人騙過,那是否就會得出河南人騙子特別多的結論?(以前我就是這么認為的,無知啊?。┛墒菬o論從理論分析,還是從相關實驗研究來看,都找不到河南人騙子多的統計數據,說明這只能是一種以訛傳訛的認知偏誤。很多網絡上的經濟、政治評論員,經常會從一兩個事件就總結出一條博人眼球的規律來,在“開化”人看來,這種行為都是很無知的。

要理解隨機分布不等于平均分布,概率和單個事件是否發生沒有直接聯系,是需要耐下心來,學一點概率知識的。這花不了多長時間,也許只要一個小時,我們就能理解大致的概念,然后在生活中慢慢實踐,鞏固和深化概率論的思維。這對我們的生活會產生非常大的幫助,我最近的就碰到這樣一個事例。有個朋友建議我關注一下分級基金,可能是分級基金在去年這波股市大行情里比較搶眼吧,肯定有不少私募關注這個東西。于是我秉著學以致用的理念,在網上百度了分級基金的概念,又找了幾篇講解分級基金套利的文章,結果發現并沒有大家傳言的那么神奇,也絕對不是一個容易賺錢的投資品。我從兩個方面得出結論,一是投資分零和與正和博弈,如果是零和博弈,要想賺取利潤就是火中取栗,需要比絕大部分競爭者更高的信息獲取能力和分析能力,還有更低的交易成本和渠道工具,很明顯我沒有。而且更有趣的是,分級基金的真實情況是,投資者出于套利的目的會高頻交易,資管方的主要收入來源就變成了申購和贖回的手續費,那就連零和博弈都算不上了,是負和博弈。另一方面就是從概率角度出發,思考套利的可能性和幾率大小,發現幾篇所謂的教學文章在風險衡量和計算母基金倉位時,完全是靠猜的,作者很明顯不懂小數定律,也犯了“只看到自己想看”的錯誤,認為套利成功是大概率事件。這種低級錯誤只能說明,作者要么很無知,要么就是別有用心,鼓動賺錢心切的投資者們參與套利。

在這個科技迅速發展、信息爆炸的時代,交點智商稅有時候在所難免,就跟以前有人貪便宜買路邊湊上來的手機筆記本,結果發現是個模型的道理是一樣的。但是現在的“坑”的技術也在進步,像分級基金這樣套了幾層外衣的韭菜收割工具,以后肯定還會層出不窮。這就需要我們好好補習一些基礎學科,配得上一個現代化公民的稱號。?

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 229,362評論 6 537
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 99,013評論 3 423
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事?!?“怎么了?”我有些...
    開封第一講書人閱讀 177,346評論 0 382
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,421評論 1 316
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 72,146評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,534評論 1 325
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,585評論 3 444
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,767評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,318評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 41,074評論 3 356
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,258評論 1 371
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,828評論 5 362
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,486評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,916評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,156評論 1 290
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,993評論 3 395
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,234評論 2 375

推薦閱讀更多精彩內容