引言
在機器學習中經常會接觸到無偏估計和有偏估計這兩類概念,本文匯總了多篇博客是講解內容,旨在深入透徹地理解這兩個概念
- 有問題歡迎在交流區探討學習,QQ:761322725
- 碼字不易,好心人隨手點個贊??
有偏估計(biased estimate)是指由
與
之間有系統誤差,其期望值不是待估參數的真值。
在統計學中,估計量的偏差(或偏差函數)是此估計量的期望值與估計參數的真值之差。偏差為零的估計量或決策規則稱為無偏的。否則該估計量是有偏的。在統計學中,“偏差”是一個函數的客觀陳述。
一句話概括就是,有偏估計是在樣本估計值和真值間存在誤差的估計
我們在日常統計中常用的樣本方差即是有偏估計量
無偏估計是用樣本統計量來估計總體參數時的一種無偏推斷。估計量的數學期望等于被估計參數的真實值,則稱此此估計量為被估計參數的無偏估計,即具有無偏性,是一種用于評價估計量優良性的準則。
無偏估計的意義是:
無偏估計常被應用于測驗分數統計中。
假如,我們可以采樣無窮無盡的樣本,那么理論上下面的估計就是精確的,
這也可以理解為,當樣本數趨于無窮時,有偏估計和無偏估計等價。
分析討論
為什么分母項變成n-1就成了無偏估計呢?
下面我們來證明其是無偏估計和有偏估計!
證明關鍵在于說明,計算樣本估計量的期望值,將該期望值與參數真值進行比較,即計算/證明。 與上面所提到的樣本無窮的假設相較,我們的實際計算中是只能采樣一批數據進行計算,
n是一個固定的數字,比如我們隨機梯度下降時,用一個batch的樣本的平均梯度,來作為整體樣本的梯度估計。另一方面,我們也不是估計一次就完事了,
我們可能會估計很多次,即首先采樣n個樣本,算一次得到和
;
再隨機采樣n個樣本算一次得到和
,依此類推得到(
),(
),…,我們想知道的是:
蘇劍林. (2019, Jun 19). 《簡述無偏估計和有偏估計 》[Blog post]. Retrieved from https://spaces.ac.cn/archives/6747
也就是說,“有限平均”的“無限平均”,是否等于我們最終要求的平均?
這里我們取用n=2,每次只取兩個樣本,來以實際例子的討論無偏估計和有偏估計。
- 首先看樣本均值的估計量
,定義樣本均值真實值為
,兩個樣本的情況下:
可見我們常用樣本均值的估計量是
,注:此處非標準嚴格的證明,僅為討論解釋
- 再看樣本方差的估計量
而準確的方差表達式為,對上式乘
即2,就可以得到準確方差。說明了其為有偏估計。
直觀來看,用有限樣本的上式來估計方差,由于樣本少了,波動也會變小,所以方差估計也會偏小,這就是所謂的有偏。
極端情況下,如果只采樣一個樣本進行估計呢?估計出來的方差就是0了,不管怎么重復實驗,結果還是0,我們總不能說整批樣本的方差一定就是0吧?這便是有偏估計的最簡單例子。
并不是所有的有偏估計都可以像方差一樣,簡單將n換成n?1就變為無偏估計了。一般情形下,我們想要估計的量,連估計本身都很難,更不要說有偏還是無偏了,所以要對一般的估計量消除偏差,都得具體問題具體分析了
推導證明
我們來嘗試證明
代入上式可得:
//總樣本方差與抽樣方差相等
通過上式也直接證明了n-1式的無偏估計特性
在各類科學計算工具包中,對這兩種估計都有不同的實現,使用時應該根據需要選擇區分。
參考資料
https://blog.csdn.net/cx1165597739/article/details/93330524
https://blog.csdn.net/weixin_31866177/article/details/89003517
蘇劍林. (2019, Jun 19). 《簡述無偏估計和有偏估計 》[Blog post]. Retrieved from https://spaces.ac.cn/archives/6747