中心極限定理導(dǎo)圖
Q1:正態(tài)分布的基本特征是什么?
-
正態(tài)分布PDF圖形
-
正態(tài)分布是一種非偏態(tài)的分布
-
正態(tài)分布的PDF圖形以期望為中心左右對稱,期望與中位數(shù)大小相等
-
概率密度值出現(xiàn)“中間高,兩邊低”的情形,使得大部分樣本都會落在期望值周圍
Q2:3σ方法與正態(tài)分布之間存在怎樣的關(guān)聯(lián)?
-
樣本落在[μ-σ,μ+σ]的概率為68.27%
-
樣本落在[μ-2σ,μ+2σ]的概率為95.45%
-
樣本落在[μ-3σ,μ+3σ]的概率為99.73%
-
樣本落在3σ之外的概率只有0.27%,這部分誤差不再屬于隨機(jī)誤差,而是粗大誤差,應(yīng)該將這部分?jǐn)?shù)據(jù)剔除
Q3:簡述常見的大數(shù)定律,以及它們之間的區(qū)別
1.大數(shù)定律的核心:將隨機(jī)變量X所對應(yīng)的隨機(jī)試驗重復(fù)多次,隨著試驗次數(shù)的增加,X的均值μ會愈發(fā)趨近于E(X)
2.辛欽大數(shù)定律:
設(shè)X1,X2,...,Xn,...是一組獨立同分布的隨機(jī)變量,E(X)=μ
則
或
依概率收斂:一個隨機(jī)變量序列(X1,X2,..,Xn)n>=1依概率收斂到某一個隨機(jī)變量X,指的是Xn和X之間存在一定差距的可能性將會隨著n的增大而趨向于0
3.伯努利大數(shù)定律:
設(shè)μ是n次獨立試驗中事件A發(fā)生的次數(shù),且事件A在每次試驗中發(fā)生的概率為P
則對任意整數(shù)ε,有
-
伯努利大數(shù)定律是辛欽大數(shù)定律的一種特殊形式
-
如果辛欽大數(shù)定律中的隨機(jī)變量序列{Xn}是特定的伯努利二次分布式,就可以得到伯努利大數(shù)定律
4.切比雪夫大數(shù)定律:
設(shè)X1,X2,...,Xn,...是一組相互獨立(或者兩兩不相關(guān))的隨機(jī)變量,它們分別存在期望μ1,μ2,...,μn,...和方差σ1,σ2,...,σn,...,
若存在常數(shù)C,使得
則對于任意小的正數(shù),滿足
-
相比于辛欽大數(shù)定律和伯努利大數(shù)定律,切比雪夫大數(shù)定律不要求同分布,只要求獨立或者不相關(guān),因此具有更強(qiáng)的廣泛性
5.三種大數(shù)定律的比較
Q4:簡述中心極限定理
1.闡述方式一
設(shè)X1,X2,...,Xn,...是一組獨立同分布的隨機(jī)變量,
當(dāng)n足夠大時,
將均值進(jìn)行標(biāo)準(zhǔn)化處理,就可以得到
2.闡述方式二
假設(shè)有來自同一個隨機(jī)試驗的一組樣本x1,x2,...,xn,...,隨機(jī)變量X表示樣本的均值,則
隨著樣本數(shù)量的增加,X的分布愈發(fā)趨近于正態(tài)分布
3.作用
-
中心極限定理表明,隨著試驗次數(shù)的增加,一組獨立同分布的變量的均值可以近似看作服從正態(tài)分布,且方差也會隨著次數(shù)的增加而變小
-
對于一組量足夠大的樣本,無論其原本服從什么分布,最終都能轉(zhuǎn)化成正態(tài)分布。
參考文獻(xiàn)
1.《拿下Offer 數(shù)據(jù)分析師求職面試指南》徐麟 著