數據中心建設----倉庫設計中的過程模型/數據模型

在數據倉庫設計過程中我們有一些可以遵循的設計模型,這里有過程模型數據模型,其中過程模型僅僅適用于操作性環境,數據模型既適用于操作型環境也適用于數據倉庫環境。如果使用的地方不當將達不到既定的目標。下圖說明它們的應用位置:

過程模型和數據模型適用的位置

過程模型:過程模型是由需求驅動的,它假設在詳細設計之前需求是已知的,但因為數據倉庫環境面臨的需求是未知的,所以它不適用于數據倉庫環境。

數據模型:數據模型既適用于操作型環境也適用于數據倉庫環境,數據模型建造時沒有考慮現有系統和數據倉庫之間的區別,它只關注原數據,所以要從企業的數據模型可以導出操作型數據模型數據倉庫型數據模型

企業模型導出操作型數據模型和數據倉庫型數據模型

數據建模的過程分為:高層建模、中間層建模底層建模

高層建模:也被叫做實體關系圖(ERD)下圖給出一個ERD的例子:

實體與關系的表示

中間層建模:也被叫做數據集(DIS),對高層建模中的每個主題域和實體都要建立一個中間層模型,但是中間層模型很少能一次性建好,總是在不斷的補充和擴展。

ERD中每個實體與其對應的DIS的進一步定義

中間層模型主要有四個基本的組成部分:

  • 主要數據分組:每個主題域有且只有一個主要數據分組,包含了每個主題域中只存在一次的屬性。
  • 二級數據分組:包含了每個主題域中存在多次的屬性。
  • 連接器:表示連個主題域之間的關系。
  • 數據的類型:數據的類型是由指向數據分組右邊的線段指示。左邊的數據分組是超類型,右邊的數據分組是數據的子類型。(不明白)
中間層數據模型的四個組成部分

底層建模:又叫物理數據模型,是從中間層模型而來,是模型中包含關鍵字和物理特性,這是物理模型看上去就是一些表,這些表叫做關系表。但是不能直接將這些表用于物理數據庫設計,還要對其做性能特性的優化。

~本文為《Building the Data Warehouse, 4th Edition 》第三章第一次讀書筆記

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容