引子:經(jīng)歷十多年的數(shù)據(jù)管理及分析相關(guān)規(guī)劃建設(shè),實施落地工作,DAMA曾是我在數(shù)據(jù)管理方面奉若圣經(jīng)的理論體系。這段時間重溫,依然有很多啟發(fā),在這里做個梳理。
第11部分:元數(shù)據(jù)管理
我的問題:
元數(shù)據(jù)在數(shù)據(jù)管理領(lǐng)域橫跨管理、業(yè)務(wù)和技術(shù),而因為其概念之大,無所不包反而變成目標最模糊的一塊領(lǐng)域,我們公司七年前就大規(guī)模建設(shè)過針對EDW的元數(shù)據(jù)平臺,進行血緣及影響分析,然而大量的人工維護成本造成無法帶來高POI,那么元數(shù)據(jù)管理如何聚焦?如何成功?
本章結(jié)構(gòu):
1.簡介
2.概念與活動(定義、歷史、戰(zhàn)略、管理活動)
3.綜述(指導(dǎo)原則、過程總結(jié)、組織和文化問題)
4.推薦閱讀(一般閱讀、圖書館學(xué)、地理空間、ISO)
從定義說起:
元數(shù)據(jù):data about data? 如此哲學(xué)化的一個描述!到底是啥:很贊的解釋如下:數(shù)據(jù)反映了真實世界的交易、事件、對象和關(guān)系;而元數(shù)據(jù):反應(yīng)的是數(shù)據(jù)的交易、事件、對象和關(guān)系。
元數(shù)據(jù)管理:關(guān)于元數(shù)據(jù)的創(chuàng)建、存儲、整合和控制等一整套流程的集成、從而支持基于元數(shù)據(jù)的相關(guān)應(yīng)用。
目標:通過計劃、實施、控制的活動,以實現(xiàn)輕松的訪問高質(zhì)量的、整合的元數(shù)據(jù)。
收益:最大的亮點:find right data at the right moment to right person;彌合IT和業(yè)務(wù)的GAP,加速系統(tǒng)開發(fā);加速并保障變更效率和質(zhì)量;識別并減少冗余,減少重復(fù)工作及不正確的數(shù)據(jù)使用。
概念和活動:
元數(shù)據(jù)是一個受控數(shù)據(jù)環(huán)境中的目錄卡。為業(yè)務(wù)用戶及IT人員展示了在哪里可以找到需要的數(shù)據(jù),這些數(shù)據(jù)從哪里來,經(jīng)歷了什么轉(zhuǎn)換,如何到達此處,數(shù)據(jù)的質(zhì)量要求等信息,有助于理解數(shù)據(jù)的真實含義和對數(shù)據(jù)進行解釋說明。
元數(shù)據(jù)包含了很多潛在領(lǐng)域,分為四大類:
1.業(yè)務(wù)元數(shù)據(jù)
2.技術(shù)和操作元數(shù)據(jù)
3.流程元數(shù)據(jù)
4.數(shù)據(jù)管理制度元數(shù)據(jù)
非結(jié)構(gòu)化元數(shù)據(jù)方面,注重描述三個方面的內(nèi)容:
1.描述性元數(shù)據(jù):是誰?目錄信息,同義詞關(guān)鍵詞術(shù)語
2.結(jié)構(gòu)元數(shù)據(jù):核心結(jié)構(gòu),字段,xml模式,特定的格式(音頻視頻等),同義詞
3.管理性元數(shù)據(jù):來源,數(shù)據(jù)源整合更新調(diào)度信息,訪問權(quán)限,頁面關(guān)系(例如:網(wǎng)站導(dǎo)航)
元數(shù)據(jù)的四種來源:人工維護;自動生成;匯總數(shù)據(jù);元數(shù)據(jù)橋接(附屬軟件,例如ERWIN中元數(shù)據(jù)的第三產(chǎn)品)
元數(shù)據(jù)的歷史(1900-2008)
元數(shù)據(jù)的標準化建設(shè)的漫漫長路:OMG CWM;MDC OIM 最終整合為一個CWM(2000年),2008年OMG發(fā)布CWM2.0,但依然有長路要走。
元數(shù)據(jù)戰(zhàn)略:關(guān)注點:
1.企業(yè)的關(guān)鍵業(yè)務(wù)驅(qū)動力、問題痛點、信息需求 并達成共識
2.戰(zhàn)略目標:藍圖(定義企業(yè)未來的元數(shù)據(jù)架構(gòu))、路線(分階段演進的實施步驟以幫助實現(xiàn)未來愿景、詳細實施清單、優(yōu)先級排序(根據(jù)產(chǎn)生的業(yè)務(wù)價值大小和資源投入多少)進行綜合排序。
3.實施階段的活動:戰(zhàn)略啟動和規(guī)劃--參與人很重要;利益相關(guān)者訪談;元數(shù)據(jù)TOBE架構(gòu)設(shè)計;開發(fā)分階段的落地任務(wù);
元數(shù)據(jù)架構(gòu)分為三種類型:集中式,分布式,混合式(其中比較好的是雙向元數(shù)據(jù)管理架構(gòu))。根據(jù)企業(yè)自身需求來看選擇那種架構(gòu)模式。在具備一定數(shù)據(jù)管理成熟度的企業(yè),建議采用集中式;
元數(shù)據(jù)標準三種:行業(yè)、共識標準(EDI-客戶、供應(yīng)商、產(chǎn)品、伙伴、監(jiān)管機構(gòu), OMG-CWM, UML,XML, SQL,XMI,ODM,W3C,非結(jié)構(gòu)化數(shù)據(jù)標準:ISO,地理,徒弟,汽車行業(yè)VIN-ISO,電力事業(yè)行業(yè)CIM);國際標準(OSO11179-元數(shù)據(jù)標準:包括數(shù)據(jù)元素的規(guī)范和標準化,分類,基礎(chǔ)屬性,數(shù)據(jù)定義的表達規(guī)則和指引,命名和標示規(guī)則,注冊);企業(yè)自定義標準;
標準化元數(shù)據(jù)的評估指標:
1.元數(shù)據(jù)存儲庫的完整性,各領(lǐng)域覆蓋度
2.元數(shù)據(jù)文檔的質(zhì)量:自動化,人工方式進行比對檢查,元數(shù)據(jù)機制的有效性
3.主數(shù)據(jù)服務(wù)合規(guī)性:SOA方案中數(shù)據(jù)的復(fù)用程度
4.管理職責和范圍:是否在企業(yè)范圍建立管理職責,執(zhí)行的有效性
5.元數(shù)據(jù)的使用/引用:統(tǒng)計,元數(shù)據(jù)平臺的使用頻率,服務(wù)范圍
6.元數(shù)據(jù)管理成熟度:CMM體系可評估
7.元數(shù)據(jù)存儲庫的可用性--在線時間、處理時間(查詢,搜索)
需要注意的時,在設(shè)計元數(shù)據(jù)平臺時,對于業(yè)務(wù)術(shù)語數(shù)據(jù)字典很重要的一點就是體現(xiàn)關(guān)系;分為三種類型:相等,層級和關(guān)聯(lián)。
總結(jié):
元數(shù)據(jù)管理建設(shè)的指導(dǎo)原則個人經(jīng)驗中最重要的四點:
1.在評估、采購和安裝元數(shù)據(jù)產(chǎn)品之前,先制定元數(shù)據(jù)戰(zhàn)略
2.最大化用戶訪問,因為沒有使用或使用率較低的方案無法體現(xiàn)業(yè)務(wù)價值
3.建立數(shù)據(jù)監(jiān)管制度,并保持業(yè)務(wù)人員對該制度的參與,賦予元數(shù)據(jù)管理職責
4.認證元數(shù)據(jù)質(zhì)量:從業(yè)務(wù)的視角定義元數(shù)據(jù)質(zhì)量評估標準。
——————————
本文版權(quán)歸:喬希 所有,轉(zhuǎn)載請先聯(lián)系我