參數(shù)估計
使用統(tǒng)計量的目的是對感興趣的問題進行統(tǒng)計推斷,而實際中,許多問題是與分布族中的未知參數(shù)有關(guān)(參數(shù)估計和檢驗問題)
一般場合,常用?表示參數(shù),參數(shù)?
?所有可能取值組成的集合稱為參數(shù)空間,常用
?表示。參數(shù)估計問題就是根據(jù)樣本構(gòu)造適當?shù)慕y(tǒng)計量對上述各種未知參數(shù)作出估計。
參數(shù)估計形式有兩種:點估計? 和? 區(qū)間估計。
點估計的概念與無偏性
對于總體??是樣本,則
?是?
的 無偏估計,
不是
?的無偏估計,利用修正技術(shù),
是?
?的無偏估計,其中?
?是正態(tài)標準差的修偏系數(shù)。 當?
?時有?
, 說明s是
的漸近無偏估計,從而在樣本容量較大時,不經(jīng)修正的 s 也是?
?的一個很好的估計。
大偏差通常被視為估計的一種不足,有人提出了多種縮小偏差的方法。以下介紹 刀切法。
并不是所有的參數(shù)都存在無偏估計,當參數(shù)存在無偏估計時,我們稱該參數(shù)是可估的,否則稱它是不可估的。
1)有效性
當參數(shù)可估時,其無偏估計可以有很多,直觀的想法是希望找到一個圍繞參數(shù)真值的波動越小越好的估計,波動大小可以用方差來衡量。因此,常用無偏估計的方差的大小作為度量無偏估計優(yōu)劣的標準,這就是有效性。
矩估計及相合性
1)替換原理和矩法估計
替換原理常指:
》用樣本矩去替換總體矩(這里的矩可以是原點矩也可以是中心矩)
》用樣本矩的函數(shù)去替換相應的總體矩的函數(shù)
根據(jù)這個替換原理,在總體分布形式未知場合也可對各種參數(shù)作出估計,如:
》用樣本均值? 估計總體均值?
》用樣本方差??估計總體方差?
》用事件?出現(xiàn)的頻率 估計事件?
?發(fā)生的概率
》用樣本的??分位數(shù)估計總體的?
?分位數(shù),特別,用樣本中位數(shù)估計總體中位數(shù)。
1)概率函數(shù)已知時未知參數(shù)的矩估計
? 當k=1時,通常可以由樣本均值出發(fā)對未知參數(shù)進行估計;如果 k=2,可以由一階、二階原點矩(或二階中心矩)出發(fā)估計未知參數(shù)。
(“矩” 是描述隨機變量分布特征的一類指標,如同使用不同的 “尺子” 去測量數(shù)據(jù)的分布形態(tài)。
原點矩是以坐標原點(0 點)為基準,對隨機變量進行不同次數(shù)的加權(quán)平均后的得數(shù),用來描述數(shù)據(jù)分布的不同特征。k階原點矩就是把每個數(shù)據(jù)先k次方,再求平均值(考慮加權(quán)平均)。
一階原點矩是 隨機變量 的數(shù)學期望,即是把所有數(shù)據(jù)加起來除以個數(shù),得到的平均值。它反映了數(shù)據(jù)的 “中心位置”。(直接平均)
二階原點矩是 隨機變量平方后的期望值,即先把每個數(shù)據(jù)都平方,再求平均值。它和 “數(shù)據(jù)的離散程度” 有關(guān),但不是方差。(平方后平均)
三階原點矩是 隨機變量立方后的期望值,即先把每個數(shù)據(jù)都立方,再求平均值。它和”數(shù)據(jù)偏斜程度“有關(guān),數(shù)據(jù)分布是否 “偏向正數(shù)” 或 “偏向負數(shù)”(是否左右不對稱)。
四階原點矩是?隨機變量平方再平方后的期望值,即先把每個數(shù)據(jù)四次方后再求平均值。它是峰度(數(shù)據(jù)分布是陡峭還是平緩)有關(guān),衡量數(shù)據(jù)分布是否有“極端值”或“尾巴粗細“。
“原點” 的含義:所有計算都以 0 為起點,不考慮數(shù)據(jù)的平均值(對比 “中心矩” 是以平均值為起點)。
階數(shù)越高:對極端值越敏感(因為高次方會放大絕對值大的數(shù)),且奇數(shù)次方矩(三階、五階)會保留數(shù)據(jù)的符號信息(正 / 負偏向),偶數(shù)次方矩(二階、四階)只關(guān)注絕對值大小。
通俗講:原點矩看整體位置,二階看平方后的”能量”,三階看偏向;四階看極端程度,更高階看更細微的扭曲。
中心矩是以數(shù)據(jù)的“平均值”為中心(基準點),衡量每個數(shù)據(jù)與平均值的偏差的不同次數(shù)的加權(quán)平均,用來描述數(shù)據(jù)分布的形狀特征(如波動、偏斜、陡峭程度等)。k階中心矩就是把每個數(shù)據(jù)“減去平均值”,再作“k次方",最后求平均值 。
一階中心矩:永遠為0,沒實際用處
二階中心矩:即方差,每個數(shù)據(jù)先減去平均值后的平方的平均,衡量數(shù)量的離散程度或波動性。(波動)
三階中心矩:每個數(shù)據(jù)先減去平均值后的立方的平均,衡量分布的 “不對稱性”;(偏斜)
四階中心矩:每個數(shù)據(jù)先減去平均值后的四次方的平均,描述分布的 “陡峭程度” 或 “尾部厚度”,實際中常用 “標準化峰度”,來判斷數(shù)據(jù)是否比正態(tài)分布更”尖“或更”平“;(峰度)
日常分析中,二階中心矩(方差)和標準化后的三階、四階中心矩(偏斜度、峰度)是最常用的 “分布形狀指標”,幫我們快速判斷數(shù)據(jù)是 “對稱的”“分散的” 還是 “有極端值的”。
2)相合性:
點估計是一個統(tǒng)計量,因此它是一個隨機變量。如果有足夠的觀測值,根據(jù)格利文科定理,隨著樣本量不斷增大,經(jīng)驗分布函數(shù)逼近真實分布函數(shù),因此完全可以要求估計量隨著樣本量的不斷增大而逼近參數(shù)真值,這就是相合性。
相合性被認為是對估計的一個最基本要求,如果一個估計量,在樣本量不斷增大時,它都不能把被估參數(shù)估計到任意指定的精度,那么這個估計是很值得懷疑的。通常,不滿足相合性要求的估計不予考慮。
若把依賴于樣本量n的估計量?看作一個隨機變量序列,相合性就是?
依概率收斂于0,所以證明估計的相合性可應用依概率收斂的性質(zhì)及各種大數(shù)定律。
由大數(shù)定律及定理6.2.2,矩估計一般都具有相合性,比如:
》樣本均值是總體均值的相合估計
》樣本標準差是總體標準差的相合估計
》樣本變異系數(shù)??是總體變異系數(shù)的相合估計。
?
最大似然估計與EM算法
”最像“就是最大似然之意。如?有兩個箱子中各有100只球,甲箱中白球的比例是p1,乙箱中白球的比例是p2,已知p1>p2,現(xiàn)隨機地抽取一個箱子并從中抽取一球,假定取到的是白球,如果我們要在兩個箱子中進行選擇,由于甲箱中白球的比例高于乙箱,根據(jù)最大似然原理,我們應該推斷該球來自甲箱。
求導函數(shù)是求最大似然估計最常用的方法。
最大似然的不變性:
1)EM算法
MLE是一種非常有效的參數(shù)估計方法,但當分布中有多余參數(shù)或數(shù)據(jù)為截尾或缺失時,期MLE的求取是比較困難的。此時可采用EM算法,其出發(fā)點是把求MLE的過程分兩步走:第一步求期望,以便把多余的部分去掉,第二步求極大值。
2)漸近正態(tài)性
最大似然估計有一個良好性質(zhì):它通常具有漸近正態(tài)性。
最小方差無偏估計
尋求點估計有各種不同的方法,對各種點估計的好壞有眾多的估計量評價標準,對同一估計量使用不同的評價標準可能會得到完全不同的結(jié)論。因此,在評價某一個估計好壞時首先要說明是在哪一個標準下,否則所論好壞則毫無意義。
1)均方誤差
相合性和漸近正態(tài)性是在大樣本場合下評價估計好壞的兩個重要標準:對無偏估計常使用方差,對有偏估計常使用均方誤差。
2)一致最步方差無偏估計
3)充分原則
4)克拉默-拉奧不等式
貝葉斯估計
統(tǒng)計中的有兩個大學派:頻率學派(也稱經(jīng)典學派)和貝葉斯學派。
1)統(tǒng)計推斷的基礎
經(jīng)典學派:統(tǒng)計推斷是根據(jù)樣本信息對總體分布或總體特征數(shù)進行推斷(統(tǒng)計推斷使用到兩種信息:總體信息和樣本信息)
貝葉斯學派:統(tǒng)計推斷除了使用總體信息和樣本信息外,還應使用 先驗信息。
先驗信息:在抽樣(試驗)前有關(guān)統(tǒng)計問題的一些信息。一般說來,先驗信息來源于經(jīng)驗和歷史資料。
貝葉斯學派基本觀點:任一未知量?都可看作隨機變量,可用一個概率分布去描述,這個分布稱為先驗分布;在獲得樣本之后 ,總體分布、樣本與先驗分布通過貝葉斯公式結(jié)合起來得到一個關(guān)于未知量
?的新分布——后驗分布;任何關(guān)于?
?的統(tǒng)計推斷都應基于?
?的后驗分布進行。
2)貝葉斯公式的密度函數(shù)形式
3)貝葉斯估計
4)共軛先驗分布
從貝葉斯公式可以看出,整個貝葉斯統(tǒng)計推斷只要先驗分布確定后就沒有理論上的困難。
關(guān)于先驗分布的確定有多種途徑,此處我們介紹一類最常用的先驗分布類--共軛先驗分布.
區(qū)間估計
1)區(qū)間估計的概念
2)樞軸量法
3)單個正態(tài)總體參數(shù)的置信區(qū)間
(1)已知時?
?的置信區(qū)間
(2)未知時
的置信區(qū)間
(3)?的置信區(qū)間
4)大樣本置信區(qū)間
5)樣本量的確定
樣本量確定問題:在一定要求下,至少需要多大的樣本量?下面介紹 估計比率 所需樣本量。
6)兩個正態(tài)總體下的置信區(qū)間
設??是來自?
?的樣本,
?是來自?
?的樣本,且兩個樣本相互獨立。
?與?
?分別是它們 的樣本均值,
?和?
?分別是它們的樣本方差。下面討論兩個均值和兩個方差比的置信區(qū)間。
(1)的置信區(qū)間
??
(2)??的置信區(qū)間
-摘自《(概率論和數(shù)理統(tǒng)計教程 茆詩松 第三版)》