大數據分析,數據可視化之美,BI

本文主要面向對象是,對 BI 完全不了解,或只是初步了解的人。

從宏觀角度介紹了 BI 的基本信息,并附以大量的圖表作為說明。期望能幫助大家對BI有更深層次的理解。

如有不同見解,也歡迎在評論補充。

至于 BI 中更深層次的東西,筆者將會在未來逐一進行介紹。

1、什么是 BI?

首先引用百度百科的定義:

商業智能(Business Intelligence,簡稱:BI),又稱商業智慧或商務智能,指用現代數據倉庫技術、線上分析處理技術、數據挖掘和數據展現技術進行數據分析以實現商業價值。

通俗一些的解釋:

BI 并不僅僅只是一個分析軟件,而是一套完整的數據分析解決方案:它將不同數據源(如 ERP、CRM、OA、HIS、EXC 等數據文件)的數據,在整合清洗——保證數據準確性后,進行針對性的數據分析和處理,最終為企業提供報表展現與可視化圖表分析,從而為企業提供決策支持。

在數據化建設較差的公司,也會將 數據可視化與 BI 直接劃上等號。

以下是一些經典的 BI 展示:

不得不承認,BI 給人的第一印象,的確是漂亮的圖表。

在實際開發中,整合數據源、清理數據等步驟往往并非由 BI 進行處理,具體分工見下圖:

正如上圖所示,BI 往往與數據倉庫技術、olap 引擎有著直接的上下游關系。其中數據倉庫主要起到統一數據源、保證數據準確度的作用;而 OLAP 引擎則幫助 BI 加速查詢。它們組合在一起,最終使用戶獲得良好的數據分析體驗。

2、BI 能做什么

BI 對企業的作用是通過兩方面實現的,業務方面和技術方面。

2.1 業務方面

數據呈現

我們可以通過 BI 直觀、全面的展現企業日常業務的情況;無論是從整個集團的視角出發、還是從業務線或者部門的角度出發。

下圖即為一個標準的 數據呈現(大屏)BI。決策層可以通過該圖表快速、直觀的了解到目前公司的會員數量和相關的銷售額——這也往往是決策層最關心的兩個指標。

為了保證數據更新的實時性和展示的美觀性,純粹的數據呈現往往并不支持聯動、下鉆、上卷等 BI 常見操作。

聯動、下載、上卷都是 BI 的專業術語,未來會逐一介紹。

異常監測

專業的業務人員會有一些核心指標來監控業務,我們完全可以將其通過 BI 實行可視化監控;

下圖即為 某在線教育對每日課程銷量的監測,運營人員通過 BI 可以迅速發覺異常變化,從而及時作出調整。

智能預測

在大數據的基礎上,BI 也能基于簡單的統計學,提供一些擬合線,來幫助業務人員進行相關分析。

下圖即 對某超市銷售額進行預測。

特定建模分析

特定的建模分析通常是由精通業務的業務人員提出,通過合理的建模找出業務中可能存在的問題,將其反映出來并最終回歸到業務,形成閉環決策并不斷優化的一個過程。

業務建模可簡單,可由一個或多個圖表組成,也可復雜,通過一組或多組數據圖表支撐。

如下圖,即為對客戶銷售額建立的模型。通過該模型,業務人員能夠快捷的了解到目前 CRM 的客戶情況。

幫助業務進行快速智能分析

盡管 BI 能滿足大部分常見需求,但資深的業務人員總會有一些突如其來的靈感。這種靈感稍縱即逝,如果等到數據部門提供數據再進行分析——可能為時已晚。如果有BI的話,業務人員可以立刻基于業務數據進行靈活分析,從而驗證想法。

2.2 技術層面

減少人工處理,提升工作效率

某些指標對每家公司都是非常重要的,無論該公司是否存在 BI、數據部門。

例如 毛利、成本、客戶。

在沒有 BI 的情況下,如果公司想要收集匯總這些指標信息,大多數時候都需要業務人員手動從各個系統提取數據,然后在 exc 上匯總——這個過程無疑是冗長、枯燥且毫無價值的。同時,還容易產生以下問題:

如果有了 BI 和對應的數據底層,就可以自動化生成相關報表。

智能報表 也屬于廣義上的 BI

數據準確性無法保證:手工計算,就有可能出錯。無法避免

數據及時性無法保證:手工計算的效率由使用者決定,無法控制

修改復雜:任何業務的新增、修改。都需要對復雜的 exc 公式進行修改。

結果倒逼,統一指標口徑

成熟的公司必然有一套統一的指標口徑;但在其野蠻生長中,指標、維度可能會缺乏統籌規劃,從而產生一些遺留問題。

舉個例子:庫存、銷售、運營口中的"銷售額"往往不是同一個"銷售額"。

最常見的口徑不一致問題,就是時間口徑不同;銷售額可以依照 下單時間,支付時間,發貨時間,收貨時間,完成訂單時間 等不同角度進行分析。在沒有統一口徑的情況下必然會出現誤解。

BI 的使用者必然包括決策層。因此,指標必然會以決策層認可的口徑為主,從而消除爭議。

整合信息孤島,統一分析平臺

數據倉庫是每家公司都應有的東西,但實際上大部分公司并不完善;但分析、統計的需求并不會因為沒有數倉而停滯。這個時候,BI 就可以啟動匯總數據源進行統一分析的效果

并不推薦長久使用 BI 作為數據匯總層。

2.3 總結:

正如上述描述,BI 更多的是從業務方出發,幫助業務解決問題。它將繁雜的數據庫底層進行整理匯總,形成有效的指標維度,讓 BI 使用者可以直觀、清楚地看到他所關注的數據,從而幫助整個企業更好的發展。在數據的自由探索中找到原因,避免“拍腦袋”式的決策。這就是 BI 的作用,而非僅僅的數據報表呈現。

3、BI 的應用場景

BI 應用場景廣泛,以下逐一枚舉。

大屏

大屏就是我們在 街頭、展覽會上常見的超大屏幕,其上大多充滿了含義不明的圖表。舉幾個例子


大屏的最大特點 就是炫。據筆者觀察,其上的數據大多都是“虛榮指標”——除了好看外一無是處。但換個角度,對外宣傳時,需要的就是好看。

設想一下,假設超市、醫院、 會議室能有一個大屏。會吸引多少目光的注意力;增加多少回頭客。

大屏的開發,有以下幾點需要注意:

因為展示效果等問題,大屏相比其他 BI,缺少交互性,無法進行聯動、鉆取等操作。

硬件成本較高——大屏很貴

BI 開發成本較高——需根據硬件實際大小進行反復調試,才能保證最終結果的展示。

數據 要求較高——主要是指數據的實時性;

駕駛艙

BI 駕駛艙是一個核心指標匯總系統,將公司的核心指標進行可視化展示,幫助決策層能通過1圖直接了解到整個企業的運營情況,也可以下鉆到各個細分業務中了解詳細數據。


因為面向對象主要為企業高層,因此駕駛艙的數據準確度、美觀度一般都是最高的。相對而言,開發成本也是最高的;

相比大屏來說,駕駛艙可以自由下鉆到任意主題的詳細看板中。分析性更強

駕駛艙則要注意這些:

數據準確性非常高——它不像大屏,錯了也沒有人知道。駕駛艙對接公司決策層,不允許有任何的數據誤差。

美觀度——領導要看的東西,你自然要花點功夫去精心調試。

看板

看板(dashborad)即為最基礎的 BI 展現方式。

相比 大屏、駕駛艙而言,dashboard 并不那么浮夸,它的主要使用對象為一般的管理人員和運營人員。一般來說,看板也可以自由的鉆取、聯動。從而幫助業務人員進行更好的分析。

移動端

部分 BI 產品也支持移動端展示,內容一般為核心指標。

移動端開發時,需要特別注意不同手機的適配度。必要情況下,可以拿用戶的實際手機款式做針對性調整。

自助分析

并非所有的儀表板,都一定由數據部門來開發完成。有能力的業務人員更希望自己可以隨時進行制作,而不受數據部門的約束。因此在數據部門提供數據底層的情況時,業務部門也會親自上陣進行開發。

4、BI 的開發方式

BI 的開發,與常見的項目開發并無兩樣

確認需求——需求分析——指標維度梳理——源數據和數據質量確認——結果表設計——ETL 開發——可視化實現。

有幾個重點需要注意:

第一步要確定 BI 的最終使用者,直接與使用者溝通會節省大量的時間。

需求分析結束后,一定要與最終使用者進行文檔確認,確保雙方理解一致。

不要輕易相信源頭提供的數據,獲取到數據后自己一定要初步檢查,確保數據質量。

demo 先行——盡早確定使用者想要的BI樣式,免得反復調試浪費時間。

5、部分BI介紹

5.1 Tableau

Tableau 毫無疑問的市場王者,也是目前全球最易于上手的報表分析工具,并且具備強大的統計分析擴展功能。它能夠根據用戶的業務需求對報表進行遷移和開發,實現業務分析人員獨立自助、簡單快速、以界面拖拽式的操作方式對業務數據進行聯機分析處理、即時查詢等功能。

但 Tabealu 也有自己的缺點:最大的缺點就是價格過于昂貴。對于大部分公司來說,如此昂貴的 Tableau 性價比并不高。

5.2 FineReport

帆軟是目前國內最大的 BI 廠商,合作廠商也相當多;產品線也遍及大屏、移動端、智能報表。可以說是最適合中國中小型企業的 BI 了。

FineReport 本是一個智能報表軟件,但由于集成了大量圖表,相比其他 BI 開發效率雖然稍慢,但是自由度更高。

5.3 Superset

Superset 是一款由 Airbnb 開源的“現代化的企業級 BI (商業智能) Web 應用程序”,其通過創建和分享 dashboard,為數據分析提供了輕量級的數據查詢和可視化方案。

Superset 的缺點就比較多了

沒有提供圖表的下鉆功能

不支持多圖表間的復雜聯動

處理大數據集時容易暴斃

權限管理和圖表管理的功能設計基本為0

但它是開源的——你無法要求一個東西又免費又好用,因此技術能力較強的公司可以考慮。

6、其他雜談

正如開題所言, BI 并非簡單的數據可視化,而是一套極度復雜的商業解決方案;

如何做到企業數據化?數據驅動業務?數據治理?

僅憑幾個EXC是遠遠不能滿足的——只有建立起良好的 BI 生態體系,企業才能真正邁入數據化。

另一方面,BI 的表象是可視化分析報表的呈現,但它的本質還是業務問題、管理問題。

如何通過 BI ,使得業務、管理能夠不斷優化,這才是值得我們深度思考的。

歡迎各位朋友學習參考,有更多建議或者想法可以留言,我們一起成長。

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,739評論 6 534
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,634評論 3 419
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,653評論 0 377
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,063評論 1 314
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,835評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,235評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,315評論 3 442
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,459評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,000評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,819評論 3 355
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,004評論 1 370
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,560評論 5 362
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,257評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,676評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,937評論 1 288
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,717評論 3 393
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,003評論 2 374