中心極限定理通俗介紹
中心極限定理收斂至大數定律
什么是中心極限定理(Central Limit Theorem)
中心極限定理指的是給定一個任意分布的總體。我每次從這些總體中隨機抽取 n 個抽樣,一共抽 m 次。 然后把這 m 組抽樣分別求出平均值。 這些平均值的分布接近正態分布。
什么是大數定律
大數定律是指在隨機試驗中,每次出現的結果不同,但是大量重復試驗出現的結果的平均值卻幾乎總是接近于某個確定的值。
其原因是,在大量的觀察試驗中,個別的、偶然的因素影響而產生的差異將會相互抵消,從而使現象的必然規律性顯示出來。例如,觀察個別或少數家庭的嬰兒出生情況,發現有的生男,有的生女,沒有一定的規律性,但是通過大量的觀察就會發現,男嬰和女嬰占嬰兒總數的比重均會趨于50%。
我們先舉個栗子??
現在我們要統計全國的人的體重,看看我國平均體重是多少。當然,我們把全國所有人的體重都調查一遍是不現實的。所以我們打算一共調查1000組,每組50個人。 然后,我們求出第一組的體重平均值、第二組的體重平均值,一直到最后一組的體重平均值。中心極限定理說:這些平均值是呈現正態分布的。并且,隨著組數的增加,效果會越好。 最后,當我們再把1000組算出來的平均值加起來取個平均值,這個平均值會接近全國平均體重。
其中要注意的幾點:
總體本身的分布不要求正態分布
上面的例子中,人的體重是正態分布的。但如果我們的例子是擲一個骰子(平均分布),最后每組的平均值也會組成一個正態分布。(神奇?。?/p>
樣本每組要足夠大,但也不需要太大
取樣本的時候,一般認為,每組大于等于30個,即可讓中心極限定理發揮作用。
話不多說,我們現在來一步步看到中心極限定理是如何起作用的。
用實際數據來展示中心極限定理
https://zhuanlan.zhihu.com/p/25241653
此例子很有說服力。
大數定理 與中心極限定理區別
大數定律:揭示了大量隨機變量的平均結果,但沒有涉及到隨機變量的分布的問題。
中心極限定理:說明的是在一定條件下,大量獨立隨機變量的平均數是以正態分布為極限的。
大數定律研究的是在什么條件下,這組數據依概率收斂于他們的均值。
中心極限定理研究的是在什么條件下,這些樣本依分布收斂于正太分布。(卯詩松的概率論與數理統計上說)
大數定律描述的是頻率穩定性,就是我們所說的頻率穩定在具體的一個數值,即為概率;
中心極限定理描述的是分布穩定性,指的是頻率有很多,但是服從正態分布,XY軸中Y最高的那個正態分布數值即為概率。
大數定理是說樣本足夠大時,會接近期望,在樣本無窮大時平均值是期望。(一個值)
中心極限定理說的是樣本距離期望的漲跌偏差分布。(出現一種分布規律)
? ? ? ? ? ? ? ? 舉個簡單的例子,一滴水從高空落下,經過一個隨機分布的風向后,落在地上。
? ? ? ? ? ? ? ? 大數定理指出,無論風向分布規律是什么,所有點距離垂直落下的點的距離應該等于一個值,這個值就是期望
? ? ? ? ? ? ? ? 中心極限定理指出,無論風向分布規律是什么,每個樣本距離期望的位置的距離分布是符合正態分布的
https://zhuanlan.zhihu.com/p/25241653
http://wiki.mbalib.com/wiki/%E5%A4%A7%E6%95%B0%E5%AE%9A%E5%BE%8B
http://wiki.mbalib.com/wiki/%E4%B8%AD%E5%BF%83%E6%9E%81%E9%99%90%E5%AE%9A%E7%90%86
https://www.zhihu.com/question/22913867
https://www.zhihu.com/question/21110761/answer/23815273