spagobi
SpagoBI是一個商業(yè)智能平臺,為商業(yè)智能項目提供了一個完整開源的解決方案。它涵蓋了一個BI系統(tǒng)所有方面的功能包括:數(shù)據(jù)挖掘、查詢、分析、報告、Dashboard儀表板。
優(yōu)點:開源
缺點:
官網(wǎng):http://www.spagobi.org/
源碼:https://github.com/SpagoBILabs
參考資料:https://www.oschina.net/p/spagobi
https://baike.baidu.com/item/SpagoBI/20132386?fr=aladdin
http://www.cnblogs.com/mybi/p/5120265.html
https://www.evget.com/article/2014/5/21/21029.html
pentaho
Pentaho是一個以工作 流為核心的、強調(diào)面向解決方案而非工具組件的BI套件,整合了多個開源項目,目標是和商業(yè)BI相抗衡。它偏向于與業(yè)務(wù)流程相結(jié)合的BI解決方案,側(cè)重于大 中型企業(yè)應(yīng)用。它允許商業(yè)分析人員或開發(fā)人員創(chuàng)建報表,儀表盤,分析模型,商業(yè)規(guī)則和BI流程。
優(yōu)點:開源,易于將報表發(fā)布到服務(wù)器。新穎的服務(wù)器用戶界面、易于安裝和規(guī)范的說明文檔。提供了多個第三方插件,還有許多Pentaho社區(qū)工具可以使用,大多數(shù)工具既與社區(qū)版兼容,又與企業(yè)版兼容。值得一提的一個工具是CTools,這是一系列組件和工具,作為Pentaho的附件而使用。Ctools擁有諸多特性,比如圖形生成器、儀表板編輯器、數(shù)據(jù)訪問定制以及Pentaho開發(fā)框架。不過總的來說,Pentaho安裝、配置和運行起來很容易。說明文檔很完備,服務(wù)器和報表設(shè)計器對于新手和專家來說同樣界面直觀。可以輕松、可靠地發(fā)布報表是一大優(yōu)點。
缺點:報表設(shè)計器和服務(wù)器方面性能有點慢。即便在配備四核處理器、內(nèi)存充足、使用千兆以太網(wǎng)的服務(wù)器級機器上也是如此。在典型臺式機上運行的報表設(shè)計器也是同樣一種情況。
官網(wǎng):http://www.pentaho.com/
社區(qū):http://www.pentahochina.com/portal.php
參考資料:https://baike.baidu.com/item/Pentaho/3674418?fr=aladdin
https://www.oschina.net/p/pentaho
http://os.51cto.com/art/201508/489167_all.htm(評測)
birt
BIRT是一個Eclipse-based開放源代碼報表系統(tǒng)。它主要是用在基于Java與J2EE的Web應(yīng)用程序上。BIRT主要由兩部分組成:一個是基于Eclipse的報表設(shè)計和一個可以加到你應(yīng)用服務(wù)的運行期組件。BIRT同時也提供一個圖形報表制作引擎。
缺點:在學(xué)習(xí)資源、學(xué)習(xí)途徑和技術(shù)交流平臺上的表現(xiàn)差強人意,數(shù)據(jù)源支持度不夠,報表操作復(fù)雜不友好。未開發(fā)出移動端平臺,只提供間接的pdf方式打印。報表表達式編輯器對中文的支持卻有些問題。沒有權(quán)限方面的輔助功能
優(yōu)點:開源,操作界面清晰直觀,布局比較科學(xué),圖表還是比較漂亮的,而且本地化做的還好,安裝之后操作界面是中文的
官網(wǎng):http://www.eclipse.org/birt/
源碼:https://github.com/eclipse/birt
社區(qū):http://birthome.com/forum.php
http://www.eclipse.org/birt/community/
參考資料:https://baike.baidu.com/item/BIRT/7747222?fr=aladdin
https://www.oschina.net/p/birt
http://www.finereport.com/knowledge/acquire/birt.html
https://zhidao.baidu.com/question/617475282444050652.html
http://highforest.blog.51cto.com/125539/42134/
ssrs
SQL
Server Reporting Services(SSRS),微軟企業(yè)級報表平臺,和SQL Server Integration Service以及SQL Server Analysis Services一樣,都是微軟BI套裝的一部分。雖然SSRS和其他微軟BI產(chǎn)品集成的很好,但SSRS和其他平臺的產(chǎn)品集成也很容易。SQL Server的報表功能為你公司提供了創(chuàng)建,分發(fā)和管理報表的功能。
使用場景:儀表盤、即時分析、管理
優(yōu)點:SSRS開發(fā)快速,部署及管理相對簡單,效果尚可
缺點:在頁眉和頁腳中綁定字段并不明顯,在cross-tabulations中不支持expando橫向匯總。沒有直接支持報表頁眉和頁腳,交互性極差。感覺技術(shù)有點老了。
社區(qū):http://www.csdn.net/tag/SSRS
https://www.hellobi.com/topic/SSRS
http://so.csdn.net/so/search/s.do?p=1&q=ssrs
參考資料:http://www.cnblogs.com/CareySon/archive/2012/02/27/2369511.html
http://bbs.csdn.net/topics/390366876
https://gxnotes.com/article/38272.html
https://ask.hellobi.com/question/12608
https://ask.hellobi.com/question/490
powerbi
Power BI是一套商業(yè)分析工具,用于在組織中提供見解。可連接數(shù)百個數(shù)據(jù)源、簡化數(shù)據(jù)準備并提供即席分析。生成美觀的報表并進行發(fā)布,供組織在Web和移動設(shè)備上使用。每個人都可創(chuàng)建個性化儀表板,獲取針對其業(yè)務(wù)的全方位獨特見解。在企業(yè)內(nèi)實現(xiàn)擴展,內(nèi)置管理和安全性。
優(yōu)點:跨終端
缺點:收費
官網(wǎng):https://powerbi.microsoft.com/zh-cn/
參考資料:https://msdn.microsoft.com/en-us/library/dn877544.aspx
https://powerbi.microsoft.com/en-us/blog/intro-pbi-js-api/
http://www.cnblogs.com/asxinyu/p/Power_BI_Introduce.html
http://www.cnblogs.com/asxinyu/
https://powerbi.microsoft.com/zh-cn/power-bi-embedded/
https://powerbi.microsoft.com/zh-cn/documentation/powerbi-service-get-started/
widestage
Lightweight BusinessIntelligence tool for reporting mongodb, postgresql, Mysql, & MS sql data
優(yōu)點:開源
缺點:國內(nèi)少見
官網(wǎng):http://widestage.com/en
源碼:https://github.com/widestage/widestage(基于nodejs實現(xiàn))
參考資料:https://www.youtube.com/watch?v=7HB8Ipb1-V8
redash
Redash是一款開源的BI工具,提供了基于web的數(shù)據(jù)庫查詢和數(shù)據(jù)可視化功能
在數(shù)據(jù)運維人員的日常工作中,常會遇到需要將數(shù)據(jù)庫中的數(shù)據(jù)查詢并展示出來的問題,可能總是需要讓前端開發(fā)人員來做web頁面幫助完成這些需求。redash提供了這么一種簡單便捷的方式將這些工作標準化:在web頁面上輸入sql語句,使用查詢返回的結(jié)果構(gòu)造數(shù)據(jù)可視化圖表,用戶可以將這些圖表結(jié)果拖動構(gòu)造成自己需要的數(shù)據(jù)面板,在很大程度上可以緩解數(shù)據(jù)運維人員對前端開發(fā)人員的需求。
官網(wǎng):https://redash.io/
源碼:https://github.com/getredash/redash(基于python)
參考資料:https://www.oschina.net/p/redash
biplatform
敏捷BI分析平臺,提供高性能、準實時、可擴展的、一站式的BI建模、分析平臺。
缺點:百度出品,可持續(xù)性堪憂
源碼:https://github.com/baidu/BIPlatform
參考資料:https://my.oschina.net/biplatform/blog?sort=time&temp=1504681846961
openi
OpenI是一個基于網(wǎng)絡(luò)的商務(wù)智能應(yīng)用程序。是一個徹頭徹尾的開發(fā)的解決方案,輕松可視化OLAP數(shù)據(jù),關(guān)系型數(shù)據(jù)庫管理系統(tǒng),數(shù)據(jù)挖掘工具和直觀的建立和發(fā)布交互式的報告,分 析。它用于制作Web OLAP報表,可以部署在任何J2EE服務(wù)器中,支持交互式OLAP報表的發(fā)布。它能夠使用關(guān)系型數(shù)據(jù)源和基于XMLA的數(shù)據(jù)源。
缺點:感覺技術(shù)有點老,好像沒人維護了
官網(wǎng):http://openi.sourceforge.net/index.html
參考資料:https://www.oschina.net/p/openi
superset
Superset其實是一個自助式數(shù)據(jù)分析工具,它的主要目標是簡化我們的數(shù)據(jù)探索分析操作,它的強大之處在于整個過程一氣呵成,幾乎不用片刻的等待。Superset通過讓用戶創(chuàng)建并且分享儀表盤的方式為數(shù)據(jù)分析人員提供一個快速的數(shù)據(jù)可視化功能。
在你用這種豐富的數(shù)據(jù)可視化方案來分析你的數(shù)據(jù)的同時,Superset還可以兼顧數(shù)據(jù)格式的拓展性、數(shù)據(jù)模型的高粒度保證、快速的復(fù)雜規(guī)則查詢、兼容主流鑒權(quán)模式(數(shù)據(jù)庫、OpenID、LDAP、OAuth或者基于Flask AppBuilder的REMOTE_USER)
通過一個定義字段、下拉聚合規(guī)則的簡單的語法層操作就讓我們可以將數(shù)據(jù)源在U上豐富地呈現(xiàn)。Superset還深度整合了Druid以保證我們在操作超大、實時數(shù)據(jù)的分片和切分都能行云流水。
官網(wǎng):http://airbnb.io/projects/superset/
源碼:https://github.com/apache/incubator-superset
參考資料:
https://segmentfault.com/a/1190000005083953
https://www.2cto.com/kf/201703/616747.html
https://www.youtube.com/watch?v=3Txm_nj_R7M
tableau
Tableau Software致力于幫助人們查看并理解數(shù)據(jù)。Tableau幫助任何人快速分析、可視化并分享信息。超過42,000家客戶通過使用Tableau在辦公室或隨時隨地快速獲得結(jié)果。數(shù)以萬計的用戶使用Tableau
Public在博客與網(wǎng)站中分享數(shù)據(jù)。
優(yōu)點:跨終端
缺點:收費
官網(wǎng):https://www.tableau.com/zh-cn/products
社區(qū):https://community.tableau.com/welcome
參考資料:https://www.zhihu.com/question/29478254
https://baike.baidu.com/item/tableau/9328520?fr=aladdin
http://shenhaolaoshi.blog.sohu.com/165130852.html
kibana
Kibana是一個開源的分析與可視化平臺,設(shè)計出來用于和Elasticsearch一起使用的。你可以用kibana搜索、查看、交互存放在Elasticsearch索引里的數(shù)據(jù),使用各種不同的圖表、表格、地圖等kibana能夠很輕易地展示高級數(shù)據(jù)分析與可視化。
優(yōu)點:開源
缺點:好像依賴于Elasticsearch
官網(wǎng):https://www.elastic.co/products/kibana
源碼:https://github.com/elastic/kibana
社區(qū):https://elasticsearch.cn/explore/category-4
參考資料:http://blog.csdn.net/ming_311/article/details/50619804
關(guān)于BI框架給出的建議
目前商業(yè)版的BI框架整體完善一些,開源的大部分都是部分功能。如果是自己研發(fā)的話,可以基于一些開源的框架。因為完整BI系統(tǒng)比較龐大,為了更好的小步快跑,打造一個敏捷的數(shù)據(jù)可視化平臺,并且省去傳統(tǒng)BI的各種邏輯層編輯映射的部分是個不錯選擇。
超大數(shù)據(jù)量的情況:
1.收集:flume、databus等
2.緩沖:kafka等消息隊列
3.存儲:hdfs等
4.計算:mr、spark、sparkstreaming、storm、akka、datasketch等
5.olap:kylin、impala、pinot、druid等
6.數(shù)據(jù)可視化:spagobi、pentaho、superset、tableau等
通用參考資料:
可視化組件及產(chǎn)品統(tǒng)計:http://www.cnblogs.com/tgzhu/p/6399713.html?utm_source=itdadao&utm_medium=referral