Hive必知必會

這是Hive知識點的一個大綱,后續會不斷地更新完善,做到對Hive相關知識點有一個比較全面的總結歸納,爭取2020年7月之前完成

環境搭建

  1. Hive集群環境搭建
  2. Hive源碼閱讀環境

Hive架構

  • Hive整體架構
  • Hive存儲格式
  • Hive數據類型
  • 執行引擎

DDL

  • DDL-數據庫操作
  • DDL-內部表&外部表
  • DDL-分區表&分桶表

DML

  • DML-數據導入、導出、Update、Delete、Merge

DQL

  • select ... from
  • where
  • group by ... having ...
  • join
  • order by、sort by、distribute by
  • 窗口函數

UDF

  • UDF 和 GenericUDF
  • UDAF 和 UDTF

優化

  • 執行計劃
  • map-side join
  • 大表join
  • 數據傾斜

參考資料

  1. 官網:https://cwiki.apache.org/confluence/display/Hive/Home
  2. 一起學hive:http://lxw1234.com/archives/2015/06/238.htm
  3. Hive必知必會:https://zhuanlan.zhihu.com/p/66705332
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容

  • Hive總結 一、Hive架構 1.架構圖 2.Hive架構解析 1)用戶接口 CLI:cli即shell命令。C...
    農民2019閱讀 1,192評論 0 1
  • 一. 什么是hive hive是基于Hadoop的一個[數據倉庫]工具,可以將結構化的數據文件映射為一張數據庫表,...
    zianL閱讀 721評論 0 0
  • hive.ddl.output.format:hive的ddl語句的輸出格式,默認是text,純文本,還有json...
    博弈史密斯閱讀 1,964評論 0 6
  • 2017年11月3日課后作業 Hive 第三天 [toc] 第二天內容回顧 Hive幫助文檔的地址 https:/...
    Albert陳凱閱讀 351評論 0 0
  • 朋友當你看到這篇文章時,你可能和我之前一樣想要成為一個自律的人,下面就來介紹下我是如何用28天的時間養成一個自...
    峰彬閱讀 384評論 1 7