標準誤
定義:從同一總體中抽取相同容量的不同樣本所產(chǎn)生的預期平均差異(抽樣分布的標準差)
計算: 標準差/樣本容量的平方根
標準誤常用于推斷統(tǒng)計量,以測度樣本統(tǒng)計值與不同隨機樣本統(tǒng)計值之間的平均差異的大小。
(標準誤總作為統(tǒng)計量的分母,標準誤越小統(tǒng)計量越大,顯著性可能性越大)
統(tǒng)計顯著性、效應量和置信區(qū)間
對顯著性的理解
完全由于隨機抽樣誤差或者偶然因素引起的樣本統(tǒng)計量落入給定值域的概率小于顯著性水平a,則稱結(jié)果是統(tǒng)計顯著的。一般代表拒絕原假設(shè)。
(p值小于a,顯著差異,拒絕原假設(shè))
假設(shè)檢驗和顯著性檢驗原理是一樣的,顯著性檢驗指假設(shè)檢驗中構(gòu)造的某參數(shù)的統(tǒng)計量進入了拒絕域
置信區(qū)間的理解
由樣本統(tǒng)計量計算出的以一定的置信水平包含總體參數(shù)的區(qū)間。95% 99%置信區(qū)間。
置信區(qū)間公式:
CI99 = 樣本均值+- 置信水平為0.05的雙尾檢驗的t值*標準誤
(置信水平95% 顯著性水平就是0.05 ) 信大
用樣本數(shù)據(jù)推斷總體時:
樣本統(tǒng)計量能多大程度推廣到總體,我們需要用到統(tǒng)計顯著性,效應量,置信區(qū)間。
效應量: 分子還是樣本統(tǒng)計量-總體參數(shù),分母是標準差
從某一統(tǒng)計量中觀測到效應大小的一種測度,消除了樣本大小的影響,來確定統(tǒng)計值的實際顯著性。
結(jié)合效應量和置信區(qū)間的結(jié)果判斷統(tǒng)計顯著性
假設(shè)檢驗的概念
根據(jù)問題的需要對總體做出某周假設(shè)H0,選擇合適的統(tǒng)計量,這個使得H0成立時分布要知道,計算出統(tǒng)計量的值,再根據(jù)顯著性水平進行檢驗,做出接受或者拒絕原假設(shè)。
(雙尾單尾顯著性或假設(shè)檢驗)
p值
在隨機誤差作用下,從給定容量樣本得到給定大小統(tǒng)計值的概率。置信區(qū)間包含總體參數(shù)的確信程度為95% 99%對應p值0.05和0.01
p<0.05 認為樣本統(tǒng)計量與總體參數(shù)有顯著性差異。
相關(guān)性
協(xié)方差公式
[圖片上傳失敗...(image-703e42-1520822248347)]
X與均值之差*Y與均值之差 再對這個成績求和求平均(也就是求成績的期望)
皮爾遜積差相關(guān)系數(shù)
X、Y的協(xié)方差除以X的標準差 Y的標準差
所以,相關(guān)系數(shù)也可以看成一種剔除了兩個變量量綱影響、標準化后的特殊協(xié)方差。
皮爾遜相關(guān)系數(shù)含義
皮爾遜相關(guān)系數(shù)幫助我們確定 一個變量平均而言是否與另一個變量相關(guān)聯(lián)。
僅僅意味著一個變量的變動對應著另外一個變量的變動,而不是因果關(guān)系。但是如果不相關(guān),就不會有因果關(guān)系。
(簡單皮爾遜系數(shù)考察的是變量之間的線性關(guān)系)