統(tǒng)計學(xué)相關(guān)系數(shù)

統(tǒng)計學(xué)相關(guān)系數(shù)
三個相關(guān)系數(shù)(pearson、spearman、kendall)反映的都是兩個變量之間變化趨勢的方向以及程度,其值范圍在-1和+1之間,0表示兩個變量不相關(guān),正值表示正相關(guān),負(fù)值表示負(fù)相關(guān),值越大表示相關(guān)性越強。

1. pearson(皮爾森相關(guān)系數(shù))

  1. 公式如下
    \rho_{x,y}=\frac{cov(X,Y)}{\sigma_{X}\sigma_{Y}}=\frac{E((X-\mu_{X})(Y-\mu_{y}))}{\sigma_{X}\sigma_{Y}}=\frac{E(XY)-E(X)E(Y)}{\sqrt{E(X^2)-E^2(X)}\sqrt{E(Y^2)-E^2(Y)}}
  2. pearson相關(guān)系數(shù)收到異常值的影響比較大。

2. spearman相關(guān)系數(shù)

  1. 秩相關(guān)系數(shù),秩可以理解成就是一種順序或者排序,那么它就是根據(jù)原始數(shù)據(jù)的排序位置進行求解,這種表征形式就沒有了求皮爾森相關(guān)性系數(shù)時那些限制,公式如下:
    \rho_{s}=1-\frac{6\sum{d_{i}^2}}{n(n^2-1)}
  2. 解釋
    d_{i}指的是變量X和變量Y的秩次的差??梢钥闯觯琒pearman是根據(jù)變量的大小順序所確定的,所以一個異常值不會對Spearman相關(guān)系數(shù)的計算造成很大影響。

3. Kendall相關(guān)系數(shù)

  1. kendall秩相關(guān)系數(shù),針對的是分類變量,通常要求的是有序的分類變量,kendall秩相關(guān)系數(shù)(R)是指設(shè)有n個統(tǒng)計對象,每個對象有兩個屬性的系數(shù)。將所有統(tǒng)計對象按屬性1取值排列,不失一般性,設(shè)此時屬性2取值的排列是亂序的。設(shè)P為兩個屬性值排列大小關(guān)系一致的統(tǒng)計對象對數(shù)。
    公式如下:
    R=\frac{p-(n*(n-1)/(2-p)}{n*(n-1)/2}=\frac{4P}{n*(n-1)}-1
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

推薦閱讀更多精彩內(nèi)容