前言
沒有聲音,再好的戲也出不來;同樣,沒有可視化,再好的數據分析也不完美,數據可視化是大數據的『最后一公里』。
當你向上級做一份關于世界人口數據的調查時,又或者你需要向客戶介紹一份基于地點的產品使用量報告,你拿出事先做好的 Excel 表格或者世界地圖,切換著 PPT,一個國家一個國家的分析,在聽眾睡眼惺忪中結束了報告;又或者你拿出了這個——統觀世界地圖的數據報表,一張清晰扼要的圖片可勝過千言萬語。希望閱讀本文后,你也可以做出一份大獲好評的數據分析報表。
Superset 是一個用于數據探索和可視化功能的開源數據分析工具。當在 GitHub 上搜索 Data Visualization 時,Superset 的收藏數比其他可視化工具高出一個數量級。
Superset 通過讓用戶創建并且分享儀表盤的方式為數據分析人員提供一個快速的數據可視化功能,用豐富的數據可視化方案來分析你的數據。炫目的可視化效果, 成熟的數據抽象層可以用來提供敏捷、美觀、穩定的交互式分析體驗。目前 Superset 支持多達47種不同的圖表,根據需求使用不同的圖表顯示不同的效果。
為了服務 Kyligence 用戶,Kyligence 開發了定制版的?Kyligence Insight for Superset,現在 Kyligence Cloud 已與 Superset 無縫集成,免去安裝和數據同步等煩惱,只需專注于數據分析。相比原生 Superset , Kyligence Insight for Superset 提供了如下新增功能:
統一用戶管理,用戶無需在 Superset 上額外創建用戶和賦予權限,統一在 Kyligence/Kylin 后端管理用戶訪問權限,直接使用 Kyligence/Kylin 賬戶登錄Superset。
支持一鍵安裝,一鍵啟動,一鍵同步 Kyligence Enterprise 數據。
無需在 Superset 端重新定義數據模型,可對海量數據直接查詢。
支持多表連接模型,支持 inner join 和 outer join。
自動適配 Kyligence/Kylin 查詢語法。
安裝步驟
Step1:申請 Kyligence Cloud 試用后,在新建集群時勾選 Superset。
Step2:待集群狀態變為 RUNNING 后點擊 Superset 并登錄。
Step3:在數據源一欄中選擇 Refresh Kylin Cube 即可自動同步 Kyligence Enterprise 中的所有數據。
Kyligence Insight for Superset 使用方法
我們以 Kyligence Enterprise 中自帶的數據為例,以時間為維度,為大家簡單展示?Kyligence Insight for Superset?的用法。當我們點擊需要查詢的 Cube 名字后可進入查詢詳情頁面,Superset 有 8 種專門針對時間序列的圖表,使用這些圖表時,你需要指定一個字段為時間維度,之后就可以對時間維度做豐富的操作。(同理,如需要使用基于地圖的圖表需要指定經緯度等字段才能使用對應的圖表)。
海量數據查詢
分析界面在各欄選擇相應的值,您可以設置時間范圍,設置時間粒度從每秒到每年,設置數據范圍,維度和度量值,以及行數限制等,然后點擊左上角的運行查詢,即可運行查詢,得到結果集圖表 。
點擊圖表類型可以更改可視化圖表類型
使用SQL 實驗室進行自定義查詢
點擊 SQL 實驗室— SQL 編輯器即可進入自定義 SQL 查詢,選擇對應的數據庫和表,輸入 SQL 查詢語句,點擊運行查詢即可得到查詢結果。在查詢結果處選擇可視化,可對查詢結果集進行可視化。
保存與分享
在數據探索界面,點擊左上角的保存 填入對應的信息,然后點擊保存。在儀表版界面,點擊 Edit Dashboard, 然后點擊 Actions 中的郵件即可使用郵件分享儀表板,收件人點擊郵件中的鏈接,即可在瀏覽器中進入到相應的儀表板頁面。
關于 Kyligence Cloud
Kyligence Cloud 是 Kyligence 公司基于云端的一站式大數據分析平臺,以 Apache Kylin 企業版(Kyligence Enterprise)為核心,為客戶將大數據分析平滑上云提供解決方案。用戶可以在公有云(如微軟 Azure、 亞馬遜 AWS、阿里云等)上快速建立大數據分析集群,接入各種云端數據源并進行建模分析, 實現對 PB 級數據的交互式分析與關鍵業務查詢的亞秒級響應。點擊申請免費試用 Kyligence Cloud。