Hive作為SQL on Hadoop最穩定、應用最廣泛的查詢引擎被大家所熟知。但是由于基于MapReduce,查詢執行速度太慢而逐步引入其他的...
前言 數據時代,數據的多源集成和快速檢索查詢是第一步,配上數據分析及可視化才能算窺得大數據一角。 創建這個項目的主要目的一是對前期工作的一些總結...
文章導讀: 什么是RBO? 什么是CBO? 我們在工作中經常會聽到這樣的聲音:“SQL查詢慢?你給數據庫加個索引啊”。雖然加索引并不一定能解決問...
文章導讀: 什么是Calcite? Calcite的主要功能? 如何快速使用Calcite? 什么是Calcite Apache Calcite...
最近幾年IT技術的發展真的是日新月異,什么云計算、大數據、機器學習、AI等等名詞層出不窮。多數程序員內心其實是恐慌的,我也時常會感到危機感。每每...
當我們決定要自己動手做一個Hadoop生態集群管理服務的時候我們已經入了運維的坑了。如果我們對于Hadoop生態集群管理服務到底有哪些功能,應該...
前面我們提到了兩個比較火的Hadoop集群運維管理工具 Ambari和Cloudera Manager。它們集安裝,配置,監控于一身,對于Had...
現在想學習大數據肯定學習Hadoop,每個新手在學習Hadoop的時候都需要去安裝一個屬于自己的測試環境才能開始愉快的玩耍。但是Hadoop的發...
2018年4月30日HBase發布了2.0的Release版本。HBase的2.0版本承載了太多的Features,共包含4551個Issues...