AI( Artificial Intelligence ):人工智能
BI( Business Intelligence ):商業智能
BI商業智能,個人感覺商業化了一些,而且感覺沒有把數據的價值體現的名稱上,也不知道為什么不直接一點叫DI(Data Intelligence )。
AI和BI似乎不可分割,起碼相輔相成。AI似乎更火熱,BI提出更早一些,似乎有點過氣和傳統的感覺,但是想想,可視化數據展示、數據可視化,這些名詞或許目前更流行,其實應該都算是BI的變種,個人感覺似乎又有點去商業化,起碼不叫什么商業可視化。
阿里云推出了大數據和人工智能DataV數據可視化、 Quick BI等等產品,且不說做到什么程度,加上手機、大屏的時代發展,就會發現數據的價值也越來越大。
由于工作對BI牽扯甚多,近來使用Metabase,準備寫一下Metabase系列,就已BI、數據可視化做引子,查找資料總結了一下,后續會更新修改。這里不講AI,不談商業,通過搜索網上資料進行整理,就說一下接觸的或者市面上BI、數據可視化的工具。
這里進行分類:重量級(商用+服務)、輕量級(開源)、商業級(服務),其它(心血來潮的一些小項目:GitDataV、DataVisualization)
一、重量級(商用+服務)
1、IBM Cognos
IBM Cognos 起初是加拿大的一家公司,后來被IBM收購。功能非常強大,可以自身創建package、立方體數據模型,通過ETL工具進行數據清洗,然后定時抽取IBM Cognos模型,自身實現配置化集群和負載均衡等功能,能夠處理大規模,多系統(財務、資金、業務、人力資源等等)數據,進行數據整合,配套工具完善且非常多,此外
- 擴展性比較強,尤其對多系統數據處理
- 權限、數據集成完善
- 網關、應用服務器、內容管理器組件靈活
- 比較重,數據量小就大材小用,一般建行等大企業用多
- 不知道現在是否支持nosql類型的數據庫
- 支持導出備份及導入等操作
1、技術架構:java + BS架構
2、適用范圍:
? 政府單位、大型企業
3、安裝部署:
? weblogic、websphere、tomcat等集成部署
4、數據源:oracle、db2、mysql關系型數據庫
5、可視化:
- 支持各種圖表展示
- 支持各種下鉆及功能性擴展
- 展示組件強大
6、支持文檔:
- 安裝文檔齊全
- 集成部署補丁包完善
- 資料論壇可查找資料,因為大型企業使用,所以個人分享的資料較少
7、權限管理:支持權限控制
8、二次開發:利用cognos自身特性進行擴展及集成開發,源代碼不開放
2、賽思
賽思是國內用的比較多的BI工具,是武漢東方賽思軟件公司開發的,目前政府、金融等單位使用的多。賽思大數據平臺,為政府部門、企業或是IT公司的大數據項目提供全方位的平臺支持。也有數據的提取、加工、調度等強大的功能。服務團隊規模有保障,解決方案完善,但是目前對nosql數據庫支持欠缺。
3、其他
- Tableau
- Microsoft (Power BI)
- SAS (Visual Analytics)
- AWS(Athena and Kinesis)
- Google (Dataproc and Big Query)
- Fusionex (Giant)
- Zendesk (Zime)
- SAP(BO)
- Oracle(BIEE)
二、輕量級(開源)
1、Superset
github地址: https://github.com/apache/incubator-superset
1、技術架構:
后端:Python + Flask( Web 應用框架 ) +SQLAlchemy(orm框架)
前端:React + Redux +D3
2、適用范圍:
開發/分析人員做好看板,業務人員瀏覽看板數據
業務人員可自行編輯圖表,查看滿足條件的結果
3、安裝部署:
? docker方式的安裝部署最簡單
4、數據源:支持各種數據源,包括Hive、Kylin等
5、可視化:
支持的圖表類型多,達47種
圖表可視化選項少,例如,數據格式選項偏少,如需添加,需要修改配置文件
可在看板中添加篩選框,支持在不同條件下查看
不支持圖表和看板分組管理
沒有提供圖表的下鉆功能,不支持多圖表間的復雜聯動
不支持跨庫的表關聯查詢
支持其他圖標庫擴展
6、支持文檔:
安裝部署和快速入門方面的文檔詳細
但具體功能和圖表制作方面的介紹文檔需要搜索資料
整體文檔資料相當簡陋
7、郵件通知:不支持
8、權限管理:
報表權限設置較復雜、繁瑣
可實現對菜單、數據源、數據表、字段、圖表、看板等權限控制
10、二次開發:
支持 RESTful API
原屬Airbnb的開源項目,有大公司團隊維護,版本更新、Bug修復、二次開發有較大保障
也有說代碼維護迭代,不活躍
2、Redash
github地址: https://github.com/getredash/redash
1、技術架構:Python + Flask + AngularJS + SQLAlchemy
2、適用范圍:由于是對SQL查詢結果進行可視化,需要開發/分析人員做好看板,業務人員瀏覽看板數據。
3、安裝部署:
安裝部署相對較麻煩
參考部署文檔
4、數據源:支持數據源比superset少,不支持Kylin
5、可視化:
支持的圖表類型不如Superset多,僅12種
圖表可視化選項多
不支持在看板種添加篩選框
不支持圖表和看板分組管理
沒有提供圖表的下鉆功能,不支持多圖表間的復雜聯動
不支持跨庫的表關聯查詢
6、支持文檔:
提供快速入門教程
每一個功能模塊都有文檔且條理清晰
7、郵件通知:支持定時發送郵件
8、權限管理:權限設置簡單,僅控制用戶組對數據源的權限(只有兩個權限:Full access或View only)
9、二次開發:
? 提供完整的 RESTful API 接口
10、源代碼:代碼質量比Superset要好,但比Metabase差一點
3、Metabase
github地址: https://github.com/metabase/metabase
1、技術架構:
前端框架:React + Redux + D3(圖表工具)
后端框架:Clojure + RING(中間件) + Compojure(路由框架) + Toucan(ORM框架)
2、適用范圍:
? 界面漂亮、友好,使用體驗好,適合業務人員使用
3、安裝部署:
- windows下安裝部署非常簡單
- docker部署簡單
4、數據源:支持數據源少(12種),不支持Hive、Kylin(硬傷)
5、創建步驟:連接數據源-->圖表-->看板-->定時任務
6、可視化:
支持的圖表類型不如superset多,僅14種
圖表可視化選項多,例如,提供數據格式多,設置靈活
可在看板中添加篩選框,支持在不同條件下查看
通過創建集合,支持圖表、看板、定時任務分組管理
提供圖表的簡單鉆取功能,不支持圖表間的復雜聯動
不支持跨庫的表關聯查詢
7、支持文檔:
? 安裝部署、快速入門、具體功能、API等方面的文檔詳細
8、郵件通知:支持定時發送郵件
9、權限管理:
權限設置單一,只有訪問權限
僅實現對數據源、數據表、圖表、集合等權限控制
10、二次開發:提供完整的API文檔,即使完全不會 Clojure,依然可以憑借豐富的 API 與文檔完成許多二次開發。
11、源代碼:
- 代碼質量最好,結構清晰,整潔度高
- clojure語法,函數式編程,學習成本較高
4、Zeppelin
github地址:https://github.com/apache/zeppelin
嚴格意義上說,Zeppelin更像是一個notebook,而不是一個單純的BI工具,來自Apache項目
1、技術架構:
? 交互式數據分析開源框架,支持多種語言, 包括Scala、Python、SparkSQL、Hive、Markdown、Shell等
2、適用范圍:似乎更適合開發人員
3、可視化:不支持sql查詢
5、SQLPad
github地址:https://github.com/rickbergfalk/sqlpad
SQLPad是一個基于Nodejs開發的直接在瀏覽器運行SQL查詢并對結果進行可視化展示工具
1、適用范圍:適合開發人員
2、數據源: MySQL, Postgres, SQL Server, Vertica, Crate, Presto等
3、可視化:特別支持sql,與Zeppelin不同,看名字就能看出來
6、CBoard
github地址:https://github.com/yzhang921/CBoard
1、技術架構:
后端:Spring+MyBatis
前端: ngularJS1和Bootstrap
2、特點:
- 國人開發的一款可視化工具
- 交互設計的不錯,但是感覺有點奇怪
- Java系
7、Davinci
github地址: https://github.com/edp963/davinci
1、技術架構:宜信開發的達芬奇,Java
2、可視化:功能還是比較全面的,只是在國內還沒有大范圍的使用
三、商業級(服務)
1、FineBI
1、技術架構:java開發
后端:spring mvc + Hibernate
前端:fineui
2、適用范圍:
開發/數據人員準備好數據,數據人員/業務人員分析。
業務人員完全可自行分析、制作可視化。整個數據分析流程分工明確。
3、安裝部署:
? 直接官網下載電腦適配的版本安裝激活即可
4、數據源:支持各種數據源,Apache Kylin、Derby、HP Vertica、IBM DB2、Informix、Sql Server、MySQL、Oracle、Pivotal Greenplum Database、Postgresql、ADS、Amazon Redshift、Apache Impala、Apache Phoenix、Gbase 8A、Gbase8S、Gbase 8T、Hadoop Hive、Kingbase、Presto、SAP HANA、SAP Sybase、Spark、Transwarp Inceptor、Hbase等主流的一些關系型數據庫及非關系數據庫MongoDB等
5、可視化:
支持的圖表類型多,達47種
圖表可視化選項少,例如,數據格式選項偏少,如需添加,需要修改配置文件
可在看板中添加篩選框,支持在不同條件下查看
不支持圖表和看板分組管理
沒有提供圖表的下鉆功能,不支持多圖表間的復雜聯動
不支持跨庫的表關聯查詢
6、支持文檔:
安裝部署和快速入門方面的文檔詳細,還有教學視頻
但具體功能和圖表制作方面的介紹文檔幾乎沒有
7、郵件通知:支持
8、權限管理:
有一套完整的數據、業務包、報表、人員部門權限管理,有流程節點。
可實現數據源、數據表、字段、圖表、看板等權限控制
9、二次開發:
不支持java層面的開發
只有web接口
能與.NET集成、JBPM工作流集成、CAS單點登錄
10、源代碼:不公開,商業產品團隊運營。
2、DataV(阿里云)
DataV旨讓更多的人看到數據可視化的魅力,幫助非專業的工程師通過圖形化的界面輕松搭建專業水準的可視化應用,滿足您會議展覽、業務監控、風險預警、地理信息分析等多種業務的展示需求。
1、配備多種場景模板
2、多種圖表組件支持
3、支持多種數據源
4、配置比較快速靈活
[圖片上傳失敗...(image-243978-1572790640460)]
[圖片上傳失敗...(image-560710-1572790640460)]
3、Sugar(百度)
連接地址: https://cloud.baidu.com/product/sugar.html
4、小馬BI
連接地址: https://xiaoma.qq.com/#/
5、網易有數
連接地址:https://bigdata.163yun.com/
四、其它
1、GitDataV
github地址: https://github.com/HongqingCao/GitDataV
GitDataV,是一個github“大數據可視化平臺”,通過它你可以更直觀的看到你在github里的一些數據:
個人信息(?),倉庫stars情況(?),倉庫語言分類(?)
倉庫公開數量(?)、粉絲數量(?)、跟隨數量(?)、倉庫數據(?)、最近你的操作(?)
最近的粉絲(?)、最近的跟隨(?)、最新信息(?)
左上角箭頭小彩蛋: 全屏(?)、 國際化語言切換(?)、返回首頁(?)
[圖片上傳失敗...(image-5a66aa-1572790640460)]
2、DataVisualization
github地址: https://github.com/SimonZhangITer/DataVisualization
將數據通過圖表的形式展現出來將大大的提升可讀性和閱讀效率
本例包含柱狀圖、折線圖、散點圖、熱力圖、復雜柱狀圖、預覽面板等
連接地址:https://dumplingbao.github.io/2019/11/03/metabase-bi-datav