數據庫 VS 數據倉庫

數據庫和數據倉庫這幾個字看起來都差不多,不就多個倉字嘛,又不是多了蒼老師?


從本質上來說,數據庫和數據倉庫都是數據的集合。沒什么不同。

但是它們的定位確是不一樣。數據庫是服務于事務處理的(OLTP),數據倉庫是服務于商業數據分析的(OLAP)。

用戶在前端進行的操作,產生了事務和數據的變化,數據庫要對這部分的數據進行增加、刪除和修改。所以數據庫的操作是相對簡單的讀寫,只作用于相對少量的數據。由于數據庫操作的主要對象的表中的事件記錄,對其進行增刪改,對應的行式存儲就是最適合數據庫的存儲方式。

基于以上特征,數據庫一般采用的軟件為MySQL,Oracle,SQLServer等關系型數據庫進行數據存儲。基于3NF原則,搭建E-R表格,結構較為復雜,存儲緊致少冗余,對讀和寫都有優化的數據結構。

而使用數據倉庫的人主要是管理和運營人員,通過對歷史數據的分析和洞察來做出相應的商業決策。所以數據倉庫要求數據很全,需要把所有的數據整合到一起,從某些維度進行深入的分析。由于數據倉庫主要是基于某些維度對大量的數據進行查詢,那么列式存儲最能提高查詢效率。

基于以上特征,數據倉庫一般采用Hive,Greenplum,AWS Redshift等分布式數據庫。在搭建數據倉庫時則根據星型模型或雪花模型創建事實表和維度表。基于事實表和維度表查出面向各個業務主題的數據,然后可視化地展現出來。因此數據倉庫的表結構相對簡單,存儲松散多冗余,一般只對讀取做優化。


數據庫和數據倉庫對比
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容

  • 上一篇:098-BigData-26Hive企業級調優 十、數據倉庫 10.1 什么是數據倉庫數據倉庫,英文名稱為...
    AncientMing閱讀 875評論 0 2
  • 數據倉庫數據倉庫(Data Warehouse)是一個面向主題的(Subject Oriented)、集成的Int...
    Albert陳凱閱讀 4,994評論 0 15
  • 前言 互聯網行業,除了數據量大之外,業務時效性要求也很高,甚至很多是要求實時的, 另外,互聯網行業的業務變化非常快...
    原上野閱讀 9,293評論 5 32
  • ORA-00001: 違反唯一約束條件 (.) 錯誤說明:當在唯一索引所對應的列上鍵入重復值時,會觸發此異常。 O...
    我想起個好名字閱讀 5,407評論 0 9
  • 一個人疲憊不堪地躺在地上,緊閉雙眼,臉色綠黃,他的生命已經奄奄一息。 他從生命的最初世界趕來,穿越漫長時空,翻過千...
    秦倪閱讀 505評論 0 2