如何低成本搭建企業數據倉庫?

隨著大數據、云計算等技術的應用和普及,互聯網環境下數據處理呈現出新的特征:業務變化快;數據來源多;系統耦合多;應用深度深。業務變化加快導致數據來源增多,以前的數據大多來自于應用系統數據庫,基本為結構化數據,比如Oracle、MySQL等數據。現在的互聯網環境下有了更多的數據,比如網站的點擊日志、視頻數據、語音數據,這些數據都需要通過統一的計算來反映企業的經營狀況。在互聯網環境下,系統耦合也相對比較多,最重要的是要注重如何在這樣的環境下加深數據整合、提升應用深度。從應用深度上來說,之前更多專注于報表分析,在大數據環境下則更多地進行算法分析,通過建立數據模型去預測和研判未來趨勢。所以在這種境況下,對于系統的需求也更高。

在高需求下,傳統倉庫必然面臨著挑戰:數據量增長過快導致運行效率下降;數據集成代價大;無法處理多樣性的數據;數據挖掘等深度分析能力欠缺。自建集群,耗資上百萬,并且還需要專業人員運維。

從2012年開始,阿里集團將之前在Hadoop上的數據體系搬遷到阿里云數加MaxCompute(原ODPS),并完成了數據體系的重構。MaxCompute能提供快速、完全托管的從GB到EB級數據倉庫解決方案,可經濟并高效的分析處理海量數據,高效的計算能力能夠很好的支撐著強大的經濟體。(《企業大數據平臺下數倉建設思路》)

之后,阿里集團開始對外服務,開始研究數據智能化和幫助外部用戶如何利用阿里的大數據平臺實現大數據應用。

阿里正將MaxCompute這樣的“核武器”快速推向全球市場,徹底改變了行業處理數據的方式。此前,大多采用自建Hadoop集群,耗資上百萬,并且還需要專業人員運維。

而MaxCompute采取按量收費的模式,僅按照0.3元/GB按量付費,即開即用。根據大部分公司的數據量來測算,一般每月只需花費數百元。

原文鏈接

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容