定義引入
以之前的200,000蘋果的重量為例,200,000蘋果(或者更多)的重量都統計出來,不太現實。但我們可以先隨機抽取100個蘋果(作為一個樣本),統計這100個蘋果的平均重量,記為。如果只是把
作為總體的平均值,肯定是不準確的,因為再次隨機抽取100個蘋果,計算出的重量的平均值和
肯定就不一樣了。那么,為了使統計結果更加準確,我們需要反復抽取多次,然后分別計算出每個樣本的平均值,分別記為:
,接著把這些數據再做平均,記為:
。那么,隨著反復抽樣次數的增多,
會趨于總體期望。如果
成立,那么
就是總體期望
的無偏估計。
定義
無偏估計是用樣本統計量來估計總體參數時的一種無偏推斷。估計量的數學期望等于被估計參數的真實值,則稱此估計量為被估計參數的無偏估計,即具有無偏性,是一種用于評價估計量優良性的準則。無偏估計的意義是:在多次重復下,它們的平均數接近所估計的參數真值。
In statistics, the bias (or bias function) of an estimator is the difference between this estimator's expected value and the true value of the parameter being estimated. An estimator or decision rule with zero bias is called unbiased. Otherwise the estimator is said to be biased.
樣本方差無偏性的證明
總體期望:
總體方差:
樣本均值:
樣本方差:
為什么 要除以n-1, 才使得 樣本方差 是 總體方差 的無偏估計?為什么除以n,樣本方差比總體方差的值偏小?為什么要調大樣本方差是除以n-1,而不是n-2,n-3或者其他數?
假設,樣本方差定義為:,根據無偏估計的定義:
,那么
根據總體方差的定義:
總體x服從
樣本均值的抽樣分布服從
,那么
所以當樣本方差的分母是n時,樣本方差總小于總體方差。如果我們將分母n替換為n-1,似乎就是無偏估計了,那么,到底是不是這樣呢,下面再推導一遍:
我們知道,樣本方差:
所以呢,,
是總體方差的無偏估計。
貝塞爾校正(Bessel's correction)
通常,稱為貝塞爾校正系數。有的文獻上也將
也稱為貝塞爾校正系數
In statistics, Bessel's correction is the use of n ? 1 instead of n in the formula for the sample variance and sample standard deviation, where n is the number of observations in a sample.This method corrects the bias in the estimation of the population variance. It also partially corrects the bias in the estimation of the population standard deviation.