Hive:基于jdk hadoop 生態圈數據倉庫工具,通過類SQL (HQL)將結構性行文件映射為一張數據庫表,通過類sql來統計數據,轉換為MR ,節省創建MR應用程序,實現快速統計查詢。
hive 構建在基于靜態批處理的hadoop ,提供數據存儲,查詢。hive 將ETL 轉換為MR,在講MR 轉換到Hadoop提交作業,在hd監控作業返回信息。hive處理幾百M數據需要分鐘級別延遲,是用來做離線分析。主要用在日志分析。不具備實時性,以及聯機事務處理(一個聯機事務處理數據庫典型的特點是,擁有大量的并發用戶,這些用戶積極地完成實時修改數據的任務)。