Tableau源自法語,意思是“圖表”,在英語里的意思是“畫畫”。 你問它到底能做什么:拖拉拽+高階、好看、交互和探索
經(jīng)常有人問我Tableau可以做什么,簡單來說:
1. 拖拉拽就實現(xiàn)數(shù)據(jù)可視化,但同時能滿足高階需求
它跟excel的透視表類似,只需要把維度拖拉拽到面板,不需要代碼,甚至還會自動幫你決定用條形圖、氣泡圖還是箱線圖。傻瓜式入門的同時,它有很多高階功能,快速表計算、參數(shù)、LOD等功能基本能滿足所有數(shù)據(jù)展示需求,還能跟R集成、調(diào)用函數(shù)和模型。
2. 好看
這不太好證明,但我印象很深,Tableau創(chuàng)始人Christian Chabot、Chris Stole和Pat Hanrahan,他們背景分別是風險投資人、計算機博士和奧斯卡視效專家,Hanrahan研發(fā)的渲染技術在《指環(huán)王》和《哈利·波特》里都有所運用。大概這就決定了Tableau除了擅長數(shù)據(jù)分析和功能能豐富之外,另一個重要基因是視覺效果。版面、配色、甚至字體,都會考慮數(shù)據(jù)可視化的需求來設計。
3. 交互和探索
這是tableau最迷人的地方,它不只是一個二維的圖表,通過交互可以查看不同層次和維度。它鼓勵讀數(shù)據(jù)的人自主探索,可以從總體看到規(guī)模趨勢、也可以不斷下鉆看到細節(jié)。類比用戶研究,相當于除了定量數(shù)據(jù),你還能做定性研究,看到每個具體用戶的信息和真實的聲音。
記住它擅長的事,如果你再拿它來做靜態(tài)的條形圖,那它真的只能是個很貴又很難用的EXCEL。
下面分享一個案例,是今年我在tableau viz 可視化比賽的作品。請看tableau鏈接:https://public.tableau.com/profile/fei.huang#!/vizhome/TableauViz_sh_final_Feihuang/1
數(shù)據(jù)是一些投資機構(包括IDG、紅杉資本、阿里、騰訊等)的投資數(shù)據(jù)。數(shù)據(jù)很簡單,11列X1975行。示例如下:

</br>
Story-把數(shù)據(jù)串成一個故事
Teablau形式有worksheet, dashboard, story。worksheet相當于單個的圖表,dashboard把多個worksheet拼成一個頁面,而story就把多頁數(shù)據(jù)串成一個故事。
現(xiàn)場只有30分鐘完成作品,需要呈現(xiàn)故事性,所以我做了個5頁的strory。
</br>
page1"感受投資風潮" ——“頁面”功能實現(xiàn)時間軸動態(tài)
這一頁只是引入,讓觀眾感受下十年間投資的變化,展示總體趨勢。圖中每個圓點是一次投資,圓圈大小表示投資額,顏色深淺為時間先后,文字標注展示投資機構和投資對象的名字,每個圓圈鼠標上移有具體每個項目的信息, "頁面“可以選擇時間,也可以動態(tài)播放。
1999~2016的16年期間,這10家機構在各地投資1974個項目,總金額超過2000億元。

</br>
page2 "看清投資風向" ——“效果”功能實現(xiàn)兩個圖表之間的聯(lián)動
這一頁的上圖是投資金額在各機構的分布隨時間的變化,每個顏色代表一家投資機構。早期是IDG、紅杉等專業(yè)投資機構為主,2008年會后騰訊和阿里開始入局,在2012年前后逐漸成為投資巨頭。
下圖展示的是投資的行業(yè)分布,每個顏色為一個行業(yè)、每個小格子為一個投資對象,通過篩選器選擇時間。早期投資對象為房產(chǎn)、旅游業(yè),后期投資行業(yè)越來越多,涉及各個領域,在2016年投資行業(yè)第一名為金融業(yè),第一名是京東金融、融資66億。

這圖最妙的地方是在鼠標指到上圖的某個時間、某個投資機構,下面的圖會展示該機構在那個時間的投資行業(yè)和對象分布。你會看到騰訊2008年還只投資游戲和廣告,2015年它投資涉及16個行業(yè),項目數(shù)都數(shù)不過來。

</br>
page3"評估投資及回報"——箱線圖+散點,展示個體和整體的水平
這個圖比較簡單,左圖放的是整體的投資金額和回報率曲線。平均投資金額在14年后暴增,平均回報率則基本穩(wěn)定在0.5。
右圖放的是不同輪次的投資金額和回報率變化。投資金額從種子輪到A/B/C/D/E輪融資金額越來越大,但在每一個階段都可能得到從0到1的投資回報率。也可以看到,并購類的回報率整體偏高,戰(zhàn)略投資金額很高、但回報率不高。
除了箱線圖展示各輪次的整體水平,每個散點都展示了一個具體項目,鼠標上移到具體的點,就能看到超出平均水平的這些點,具體都是什么項目。

TIPS: 投資金額和回報率跟什么東西有關?有些人會試圖強制找到規(guī)律,做個回歸曲線之類的,但這數(shù)據(jù)連續(xù)變量只有金額和回報率,他兩之間并不是正相關關系,再加上極值很多、即使有模型也并不適用。通過桌面研究和整理數(shù)據(jù)后來發(fā)現(xiàn),金額最重要的變量是投資輪次,而回報率,沒有規(guī)律就是最大的規(guī)律。
</br>
page4 “探索優(yōu)質(zhì)項目”——聚類分析產(chǎn)生新變量
這一頁比較復雜,首先左上角的圖,根據(jù)投資金額和回報率,把所有項目通過tableau內(nèi)置的聚類算法分成6類,直觀的看到:高投資金額分為高回報和低回報,低投資金額分為低、中低、中高、高回報。
項目分為六類后,右上角圖展示的是各家投資機構六類項目的分布。看到高投資項目主要是阿里、騰訊、紅杉,而低投資的項目,除了光源資本,各家都有低、中低、中高、高回報項目,只是比例略有不同。
下圖則展示的是所有投資項目獲得的投資的輪次、以及每一次融資的詳情,這時候這個圖幾乎已經(jīng)把所有的數(shù)據(jù)都展示出來了。用LOD功能計算每個項目的投資輪次、按輪次排序。
</br>同樣它可以跟上面兩個圖做聯(lián)動。比如選擇一個高投資、低回報的一次投資,投資對象是美團,可以看到美團在A B 輪時主要是低/中低回報的,C輪是低投資高回報,E輪則進入高投資階段,投資他的機構有每輪都參與的紅杉,以及騰訊和阿里巴巴。

</br>
page5“end”——展示每一個數(shù)據(jù)點
這一頁只是個結尾頁,沒有很多信息,上面每一個點展示的是一次投資,顏色表示行業(yè)、大小表示投資額。
</br>
你是不是想投訴我圖片都看不清,看不清————說明tableau做的事情不是圖片能解決的~
請再看一次tableau public鏈接:https://public.tableau.com/profile/fei.huang#!/vizhome/TableauViz_sh_final_Feihuang/1