打造輕量級OLAP(一):Spark計算Cube - Treant - 博客園
http://www.cnblogs.com/en-heng/p/5382224.html
打造輕量級OLAP(一):Spark計算Cube
有一個數據多維分析的任務:
日志的周UV;
APP的收集量及標注量,TOP 20 APP(周UV),TOP 20 APP標注分類(周UV);
手機機型的收集量及標注量,TOP 20 機型(周UV),TOP 20 手機廠商(周UV);
初始的解決方案:Spark讀取數據日志,然后根據分析需求逐一進行map、distinct、reduceByKey得到分析結果。但是,這種方案存在著非常大的缺點——重復掃描數據源多次。
- Pig
Pig提供cube關鍵字做OLAP,將dimension分為了兩類: