小數(shù)法則是一種認知偏差,人們習慣于將小樣本中某事件的概率分布當成了總體分布。
有一項研究對美國3141個縣的腎癌發(fā)病率進行調(diào)查,調(diào)查結(jié)果顯示發(fā)病率最低的縣都位于人口稀少的鄉(xiāng)村。通過這一調(diào)查結(jié)果,人們很容易得到結(jié)論,認為腎癌發(fā)病率低主要是因為鄉(xiāng)村的生活方式更健康,擁有純凈的空氣和飲用水,蔬菜沒有打農(nóng)藥和添加劑,人的壓力也更小。
現(xiàn)在,想一下腎癌發(fā)病率最高的縣的情況吧。假如這些易發(fā)病的地方差不多同樣位于人煙稀少的鄉(xiāng)村。這時,人們又會作出推斷,導致腎癌高發(fā)的原因是鄉(xiāng)村的貧困——醫(yī)療條件差,不講究衛(wèi)生,高鹽高脂肪飲食,酗酒,性格暴躁。這樣,問題就來了,鄉(xiāng)村方式不可能既是發(fā)病率高又是發(fā)病率低的原因。
問題的關(guān)鍵不是這些縣位于農(nóng)村,而是鄉(xiāng)村的人口稀少。相對于大樣本,極端的結(jié)果(高發(fā)病率和低發(fā)病率)更容易出現(xiàn)在小樣本中。人口的稀少既不能引發(fā)癌癥,也不能躲避癌癥,只會使癌癥的發(fā)病率比人口聚集的地區(qū)更高或更低。在某個人口稀少的縣,癌癥發(fā)病率并非比人多的地方更高或更低,只是這個縣正巧趕上了一個特殊的年份調(diào)查而已。
對小數(shù)法則的盲信在我們的生活中隨處可見,大部分人相信小樣本能反映調(diào)查對象的整體情況,這也就是我們通常所講的“以偏概全”吧。
比如說:現(xiàn)在如日中天的知識付費,大家看到李笑來、薛兆豐、萬維剛、武志紅等大神在得到的專欄訂閱量動輒幾萬甚至十幾萬。于是,很多人認為中國成年人為了知識付費的浪潮已經(jīng)滾滾而來,但事實卻是:相對于中國十幾億的人口來說,萬的數(shù)量級根本不能說明什么,相反,我們看到的更多的是,沒幾個人會想到為一本電子書付出哪怕10塊錢的價格,他們想的是免費……
很多人看到有些人做生意、開店賺了不少錢,發(fā)達了,實現(xiàn)財富自由了,可以用金錢買別人的時間了。于是,不管自己懂不懂做生意,不管自己有沒有經(jīng)濟實力,不管自己有沒有經(jīng)營頭腦,也跑去開店、做生意,以為自己比別人厲害,只要做生意就一定會賺錢、會發(fā)財,到最后,不但錢沒賺到,還搭進了自己的老本。這也是因為他們只看到了那些少數(shù)做生意成功的人的輝煌,而沒有考慮到大部分做生意的人的經(jīng)營慘淡。
夸大對小樣本的信任只是眾多認知偏差中的一種,為了更好的消除小數(shù)定律的不良影響,我們應該知道:大樣本比小樣本更精確,小樣本比大樣本產(chǎn)生極端結(jié)果的概率大。