基礎(chǔ)知識(三)統(tǒng)計&數(shù)據(jù)分析知識——中心極限定理

中心極限定理導(dǎo)圖

Q1:正態(tài)分布的基本特征是什么?

  • 正態(tài)分布PDF圖形

  • 正態(tài)分布是一種非偏態(tài)的分布

  • 正態(tài)分布的PDF圖形以期望為中心左右對稱,期望與中位數(shù)大小相等

  • 概率密度值出現(xiàn)“中間高,兩邊低”的情形,使得大部分樣本都會落在期望值周圍

Q2:3σ方法與正態(tài)分布之間存在怎樣的關(guān)聯(lián)?

  • 樣本落在[μ-σ,μ+σ]的概率為68.27%

  • 樣本落在[μ-2σ,μ+2σ]的概率為95.45%

  • 樣本落在[μ-3σ,μ+3σ]的概率為99.73%

  • 樣本落在3σ之外的概率只有0.27%,這部分誤差不再屬于隨機(jī)誤差,而是粗大誤差,應(yīng)該將這部分?jǐn)?shù)據(jù)剔除

Q3:簡述常見的大數(shù)定律,以及它們之間的區(qū)別

1.大數(shù)定律的核心:將隨機(jī)變量X所對應(yīng)的隨機(jī)試驗重復(fù)多次,隨著試驗次數(shù)的增加,X的均值μ會愈發(fā)趨近于E(X)

2.辛欽大數(shù)定律:

設(shè)X1,X2,...,Xn,...是一組獨立同分布的隨機(jī)變量,E(X)=μ

依概率收斂:一個隨機(jī)變量序列(X1,X2,..,Xn)n>=1依概率收斂到某一個隨機(jī)變量X,指的是Xn和X之間存在一定差距的可能性將會隨著n的增大而趨向于0

3.伯努利大數(shù)定律:

設(shè)μ是n次獨立試驗中事件A發(fā)生的次數(shù),且事件A在每次試驗中發(fā)生的概率為P

則對任意整數(shù)ε,有

  • 伯努利大數(shù)定律是辛欽大數(shù)定律的一種特殊形式

  • 如果辛欽大數(shù)定律中的隨機(jī)變量序列{Xn}是特定的伯努利二次分布式,就可以得到伯努利大數(shù)定律

4.切比雪夫大數(shù)定律:

設(shè)X1,X2,...,Xn,...是一組相互獨立(或者兩兩不相關(guān))的隨機(jī)變量,它們分別存在期望μ1,μ2,...,μn,...和方差σ1,σ2,...,σn,...,

若存在常數(shù)C,使得

則對于任意小的正數(shù),滿足

  • 相比于辛欽大數(shù)定律和伯努利大數(shù)定律,切比雪夫大數(shù)定律不要求同分布,只要求獨立或者不相關(guān),因此具有更強(qiáng)的廣泛性

5.三種大數(shù)定律的比較

Q4:簡述中心極限定理

1.闡述方式一

設(shè)X1,X2,...,Xn,...是一組獨立同分布的隨機(jī)變量,

當(dāng)n足夠大時,

將均值進(jìn)行標(biāo)準(zhǔn)化處理,就可以得到

2.闡述方式二

假設(shè)有來自同一個隨機(jī)試驗的一組樣本x1,x2,...,xn,...,隨機(jī)變量X表示樣本的均值,則

隨著樣本數(shù)量的增加,X的分布愈發(fā)趨近于正態(tài)分布

3.作用

  • 中心極限定理表明,隨著試驗次數(shù)的增加,一組獨立同分布的變量的均值可以近似看作服從正態(tài)分布,且方差也會隨著次數(shù)的增加而變小

  • 對于一組量足夠大的樣本,無論其原本服從什么分布,最終都能轉(zhuǎn)化成正態(tài)分布。


參考文獻(xiàn)

1.《拿下Offer 數(shù)據(jù)分析師求職面試指南》徐麟 著

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

推薦閱讀更多精彩內(nèi)容