本文出自我的好友,Excel圖表大神:蘇有熊。
為保持風(fēng)格一致,稍作排版和內(nèi)容修改,具體可以點(diǎn)擊【閱讀原文】。
更多圖表干貨,請關(guān)注《商業(yè)圖表指南》。
這兩天我工作中遇到一個新問題,需要比較兩組數(shù)據(jù)的整體差異性,各有約900個數(shù)據(jù)點(diǎn)。
從數(shù)據(jù)結(jié)構(gòu)上來看,是關(guān)于 900個類別對象、兩組相關(guān)數(shù)據(jù) 的度量值;而本質(zhì)上,這可以算是,一個統(tǒng)計(jì)問題,術(shù)語可以稱作“多樣本的成對數(shù)據(jù)分析”。
/ 1 /
從一個散點(diǎn)圖開始
900個數(shù)據(jù)密密麻麻,單憑對數(shù)據(jù)的直接觀察,很難看出什么東西來。
于是我畫了下面這張圖,通過可視化的方式去比較這兩組數(shù)據(jù)的整體差異表現(xiàn):
簡單說明一下,這個圖表的閱讀方法:
1- XY軸最大最小值相同(但是Y軸不等距,為對數(shù)刻度),表示數(shù)據(jù)X和Y因子。加入一條趨勢線,可以清晰的表達(dá)數(shù)據(jù)的X和Y坐標(biāo)關(guān)系。
2- 理論上來講,離趨勢線越近的數(shù)據(jù)點(diǎn),其XY值之間的差異越小。
為了驗(yàn)證這個猜測,我挑選了幾個趨勢線上的數(shù)據(jù)點(diǎn),利用數(shù)據(jù)標(biāo)簽顯示其XY值,得到如下圖形:
成功!趨勢線將整個數(shù)據(jù)區(qū)域分割成了兩個對等的區(qū)域。
拉登解說:因?yàn)閅軸是對數(shù)刻度,所以視覺上看著是不對等的....
另外,仔細(xì)觀察,我們不難發(fā)現(xiàn),圖表中的幾條規(guī)律。
1- 趨勢線的上方區(qū)域,表示Y值大于X值;反之,趨勢線的下方,表示X值大于Y值。
2- 通過圖形觀察數(shù)據(jù)點(diǎn)與趨勢線的分離程度,則可以直觀反映出所有數(shù)據(jù)對象兩個度量值的整體差異。
3- 加入R平方值可以量化這個兩組數(shù)據(jù)的吻合度,在這里R平方值等于0.8661,可以看做兩組數(shù)據(jù)的整體吻合程度達(dá)到了86.61%,差異是一個較小的程度。
拉登解說:為了讓圖表的信息傳遞的更精確,備注圖表的閱讀方法、關(guān)鍵信息,是非常有必要的,也能體現(xiàn)圖表作者的專業(yè)度。
/ 2 /
7個會說話的圖表
通過上面這個案例,我們可以感受到圖表的魅力:讓數(shù)據(jù)變的更加的直觀,簡單易懂!
實(shí)際上,這種呈現(xiàn)的方式在《經(jīng)濟(jì)學(xué)人》的圖表中最為常見。
下面是從經(jīng)濟(jì)學(xué)人的圖表庫中挑選的一些例圖,我們來感受一下,其應(yīng)用的方式和細(xì)節(jié)的處理。
1- 高血壓患病率分析圖
這個圖表的數(shù)據(jù),源自是對數(shù)十個國家高血壓患病率的采樣分析,目標(biāo)是確定高血壓的性別差異,其中:
1- X軸為女性高血壓的患病率
2- Y軸為男性高血壓的患病率
這張圖的樣式非常好。利用一條對角線將散點(diǎn)圖分為對等的兩部分,我們可以很清楚的觀察出:
1- 數(shù)據(jù)點(diǎn),大部分落在上方的三角區(qū)域(男性)。這表明,大部分所選國家,男性高血壓的患病率遠(yuǎn)高于女性,女性患病率高于男性的,集中在部分非洲國家;
2- 黃色圓點(diǎn)(高收入西方國家)代表的高血壓患病率,整體處于較低水平。
3- 相對的,深藍(lán)色圓點(diǎn)(中歐和東歐國家的男性)高血壓患病率在所有樣本國家中處于最高水平。
通過對樣本國家以所屬地理位置的分組,也可以很清晰的觀察出各地域之間的差異。
2-GDP和獻(xiàn)血次量關(guān)系分析圖
這個圖反映的是,樣本國家的人均GDP,和每1000人獻(xiàn)血次數(shù)的兩組度量值的成對比較。
上面的類似,但是稍有不同的是,分割數(shù)據(jù)區(qū)域的趨勢線是一個弧形,將XY軸的其中一個設(shè)置為對數(shù)刻度可以實(shí)現(xiàn)這個效果。同樣的:
1- 高于趨勢線的數(shù)據(jù)點(diǎn)所代表的國家,居民的獻(xiàn)血意愿較強(qiáng);
2- 反之,趨勢線以下的,獻(xiàn)血意愿較低。
3- 出生率和財(cái)富關(guān)系圖
第2個圖表中,兩指標(biāo)間呈現(xiàn)正相關(guān),而上面這張例圖,兩指標(biāo)間呈負(fù)相關(guān)關(guān)系。
4-政府工信度和媒體滿意度關(guān)系圖
同樣的,圖中的斜線代表政府工信度,和媒體可信度的關(guān)系。
1- 數(shù)據(jù)越靠上,代表更相信媒體的可信度。
2- 數(shù)據(jù)越靠下,則代表相信政府的工信度。
5-男女員工薪酬對比圖
數(shù)據(jù)偏向右側(cè),表示男性的薪水,高于女性的薪水。
6- 薪酬分布圖
7- 一胎生育年齡直方圖
/ 3 /
商業(yè)圖表巨頭《經(jīng)濟(jì)學(xué)人》
以上7幅世界頂尖水準(zhǔn)的例圖,除例圖5來自于FT金融時(shí)報(bào)外,其余均來自于世界商業(yè)圖表領(lǐng)域的巨頭、或者說是王者——《經(jīng)濟(jì)學(xué)人》。
大家可以細(xì)細(xì)品味每一張圖表的制圖思路,以及細(xì)節(jié)處理。
更多優(yōu)質(zhì)的圖表,可以通過下面幾種方式,關(guān)注經(jīng)濟(jì)學(xué)人。
1- 官方網(wǎng)站
http://www.economist.com/(需要梯子)
2- 官方微博
3- 官方微信公眾號
看得多了,遇到合適的案例數(shù)據(jù),試著去用自己熟悉的工具去實(shí)現(xiàn),其表現(xiàn)力將是強(qiáng)大的,外觀也稱得上超凡脫俗、別具一格。
最后強(qiáng)調(diào)一句,以上圖表樣式,均可以用Excel實(shí)現(xiàn)。
本文首發(fā)公眾號【拉小登】
我是拉小登,源于Excel,不只是Excel