這是Hive知識點的一個大綱,后續會不斷地更新完善,做到對Hive相關知識點有一個比較全面的總結歸納,爭取2020年7月之前完成
環境搭建
- Hive集群環境搭建
- Hive源碼閱讀環境
Hive架構
- Hive整體架構
- Hive存儲格式
- Hive數據類型
- 執行引擎
DDL
- DDL-數據庫操作
- DDL-內部表&外部表
- DDL-分區表&分桶表
DML
- DML-數據導入、導出、Update、Delete、Merge
DQL
- select ... from
- where
- group by ... having ...
- join
- order by、sort by、distribute by
- 窗口函數
UDF
- UDF 和 GenericUDF
- UDAF 和 UDTF
優化
- 執行計劃
- map-side join
- 大表join
- 數據傾斜