需求:從性別、年齡、 職業、城市、居住年限,婚姻狀況等維度找到高質量用戶,并查看高質量用戶人群的占比,為其提供高價值消費品 (定位高價值消費品以...

需求:從性別、年齡、 職業、城市、居住年限,婚姻狀況等維度找到高質量用戶,并查看高質量用戶人群的占比,為其提供高價值消費品 (定位高價值消費品以...
使用場景 需要查找最近修改時間在指定范圍內的hive表或者hive表的相關分區,代碼如下:
日常檢查ETLjob時發現一段sql采用hive on mr執行比hive on spark要快70%,與正常的認知正好相反,所以對該sql進行...
本文種記錄的大多是開源版本hive調優方式 我也會補充TDH集群Inceptor的優化方式 面試必備技能-HiveSQL優化 Hive SQL基...
分桶字段選擇 進行分桶之前需要對表的數據分布情況進行大致的分析,一般遵循的原則為,選擇離散度高的字段進行分桶。可以通過收集的數據特征,如Dist...
Hive的數學函數包含兩種,一種是內嵌函數,一種是由java定義的自定義函數。對于不懂Java的數據分析師,掌握Hive的內嵌函數就顯得尤為重要...
一、安裝hive前提條件 hive運行在hadoop集群上,所以先要確保你的hadoop集群已經安裝完畢并且可正常啟動運行。如果沒安裝好hado...
前言: 針對有sql基礎,剛熟悉linux界面,在此進行hive的入門學習分享,文章結合網絡資料并加以細化步驟。本文步驟參照:https://w...
前言: 以sql為基礎,利用題目進行hive的語句練習,逐步體會sql與hive的不同之處。本次練習題來源:https://www.cnblog...
前言: 以sql為基礎,利用題目進行hive的語句練習,逐步體會sql與hive的不同之處。 題目用到hive的集合函數,使用了collect_...