在很多情況下,我們所關心的不僅僅是行或列變量本身,而是行變量和列變量的相互關系,這就是因子分析等方法無法解釋的了。1970年法國統(tǒng)計學家J.P.Benzenci提出對應分析,也稱關聯(lián)分析、R-Q型因子分析,其是一種多元相依變量統(tǒng)計分析技術(shù)。它通過分析由定性變量構(gòu)成的交互匯總表,來揭示同一變量各類別之間的差異,以及不同變量各類別之間的對應關系,這是一種非常好的分析調(diào)查問卷的手段。
對應分析是一種視覺化的數(shù)據(jù)分析方法,其基木思想是將一個聯(lián)列表的行和列中各元素的比例結(jié)構(gòu)以點的形式在較低維的空間中表示出來,優(yōu)點在于能夠?qū)捉M看不出任何聯(lián)系的數(shù)據(jù),通過視覺上可以接受的定位圖展現(xiàn)出來,使用起來直觀、簡單、方便,因此廣泛應用于市場細分、產(chǎn)品定位、地質(zhì)研究以及計算機工程等領域。
library(MASS)
ch <- data.frame(A=c(47,22,10), B=c(31,32,11), C=c(2,21,25), D=c(1,10,20))
rownames(ch) <- c("Pure-Chinese", "Semi-Chinese", "Pure-English")
ch.ca <- corresp(ch, nf=2)
biplot(ch.ca)