淺談數據倉庫

首先說說BI,我的理解BI包括DW,ETL和相應的可視化軟件,現在一般的公司說要上個BI系統其實都是要從DW建模開始做,然后ETL,最后做對應的前端報表工具,雖然最終領導們只看到了自己想要的報表,但是這一套系統是需要DW和ETL支持才能更好的服務終端輸出的報表。而數據倉庫,英文就是DW(DateWarehouse)就好比地基,是整個一套BI流程中的基礎,只有做好了DW才能為之后的ETL,報表展現打下堅實的基礎。

數據倉庫的特性

標題標題

數據倉庫(DW)與傳統的數據庫(Datebase)是不同的。數據庫是未經整理的數據集合;數據倉庫是從數據庫中抽取出來,經過整理、規劃、建構而形成的已個系統的數據庫的子集合。數據倉庫具有下列集中特性:

一、面向主體(Subject Orient)

數據倉庫的信息系統,數據建立的著重點在于以重要的主題組件為核心,作為建構的方向。數據需求者只要把要研究的相關主題數據,從數據庫中抽取、整合之后就可以做研究分析。

二、集成性(Integrated)

各應用系統的數據需經過整合,以方便執行相關分析作業。

三、時變性(Time Variance)

數據倉庫系統,為了執行趨勢的分析,常需保留1~10年的歷史數據。這與數據庫保留日常性的數據有所不同。

四、穩定性(Non-Volatile)

數據庫的數據可以隨時被改動,但是數據倉庫的數據,并非日常性的數據而是歷史性的數據,通常作為長期性分析用途,只有內部相關人員會定期地修改數據結構,但頻率不會太高,數據倉庫并不允許使用者去做更新,所以其數據較少變動。

如果不將搜集的數據庫先行整理、清理、歸類、系統化,我們將無法從龐大的數據庫中取得想要的數據進行分析。唯有先將數據庫轉換為數據倉庫,才能從中獲取想要的信息,否則數據庫中的數據仍只是一些數字和文字,并不能成為企業決策的參考。

說了這么多,只是想表達DW重要性,更是整個BI的重中之重。如果沒有DW,而把整個BI流程都交給報表工具去做,甚至是不做,那對于前端工具來說壓力未免太大,畢竟可視化軟件只是用作把有效的數據轉變成更直觀的圖形展現出來。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容