Hadoop離線數據分析平臺實戰——410事件分析
項目進度
模塊名稱 | 完成情況 |
---|---|
用戶基本信息分析(MR)? | 完成 |
瀏覽器信息分析(MR) | 完成 |
地域信息分析(MR) | 完成 |
外鏈信息分析(MR) | 完成 |
用戶瀏覽深度分析(Hive) | 完成 |
訂單分析(Hive) | 未完成 |
事件分析(Hive) | 未完成 |
模塊介紹
事件分析我們主要只是分析事件的觸發次數,
通過查看事件的觸發次數我們可以得到事件轉換率或者用戶會此類事件的興趣所在之處以及不喜之處。
計算規則
計算event事件中,計算category和action分組后的記錄個數,不涉及到任何的去重操作。
最終數據保存:stats_event。涉及到所有列。
涉及到其他表有dimension_platform、dimension_date、dimension_event。
代碼步驟
- hive自定義函數定義
- hive中創建hbase對應的外部表
- hive腳步編寫
- sqoop腳步編寫
- 測試
參考:..\代碼\transformer\hive\en\statsEvent.hql