統(tǒng)計學(xué)相關(guān)系數(shù)
三個相關(guān)系數(shù)(pearson、spearman、kendall)反映的都是兩個變量之間變化趨勢的方向以及程度,其值范圍在-1和+1之間,0表示兩個變量不相關(guān),正值表示正相關(guān),負(fù)值表示負(fù)相關(guān),值越大表示相關(guān)性越強。
1. pearson(皮爾森相關(guān)系數(shù))
- 公式如下
- pearson相關(guān)系數(shù)收到異常值的影響比較大。
2. spearman相關(guān)系數(shù)
- 秩相關(guān)系數(shù),秩可以理解成就是一種順序或者排序,那么它就是根據(jù)原始數(shù)據(jù)的排序位置進行求解,這種表征形式就沒有了求皮爾森相關(guān)性系數(shù)時那些限制,公式如下:
- 解釋
指的是變量X和變量Y的秩次的差??梢钥闯觯琒pearman是根據(jù)變量的大小順序所確定的,所以一個異常值不會對Spearman相關(guān)系數(shù)的計算造成很大影響。
3. Kendall相關(guān)系數(shù)
- kendall秩相關(guān)系數(shù),針對的是分類變量,通常要求的是有序的分類變量,kendall秩相關(guān)系數(shù)(R)是指設(shè)有n個統(tǒng)計對象,每個對象有兩個屬性的系數(shù)。將所有統(tǒng)計對象按屬性1取值排列,不失一般性,設(shè)此時屬性2取值的排列是亂序的。設(shè)P為兩個屬性值排列大小關(guān)系一致的統(tǒng)計對象對數(shù)。
公式如下: