Hive作為Hadoop家族的重要一員,具有學(xué)習(xí)成本低,開(kāi)發(fā)者可通過(guò)類SQL語(yǔ)句快速實(shí)現(xiàn)簡(jiǎn)單的MapReduce統(tǒng)計(jì),不必開(kāi)發(fā)專門的MapReduce應(yīng)用。在攢庫(kù)中,Hive也不負(fù)眾望,得到了非常高的票數(shù)。為此,CSDN知識(shí)庫(kù)特邀社區(qū)專家蔣守壯(博客: http://blog.csdn.net/jiangshouzhuang
)繪制了Hive技術(shù)圖譜,幫助廣大開(kāi)發(fā)者更加系統(tǒng)、全面的學(xué)習(xí)Hive技術(shù)。
Hive知識(shí)庫(kù)發(fā)布,速來(lái)關(guān)注!
我要成為Hive專家團(tuán)一員,篩選優(yōu)質(zhì)內(nèi)容>>猛戳這里: http://lib.csdn.net/experts/invite
點(diǎn)擊下載Hive高清技能圖譜
Hive知識(shí)庫(kù)精華內(nèi)容一瞥*****基于Hadoop的數(shù)據(jù)倉(cāng)庫(kù)Hive基礎(chǔ)知識(shí)*
本文從Hive概述、Hive系統(tǒng)架構(gòu)、Hive工作原理、Hive HA基本原理、Impala五大方面詳細(xì)講解了Hive,對(duì)于每個(gè)準(zhǔn)備學(xué)習(xí)和使用Hive的開(kāi)發(fā)者,都應(yīng)該讀一讀。
使用Hadoop和Hive獲取機(jī)器數(shù)據(jù)
在探索數(shù)據(jù)存儲(chǔ)和供給的基本機(jī)制之前,開(kāi)發(fā)者需要考慮存儲(chǔ)何種信息,如何存儲(chǔ)它,以及打算存儲(chǔ)多長(zhǎng)時(shí)間。本文就Hadoop和Hive如何存儲(chǔ)及獲取數(shù)據(jù)進(jìn)行了全面分析。
Hive最強(qiáng)大的地方是可以將SQL語(yǔ)句最終轉(zhuǎn)化為MapReduce作業(yè)進(jìn)行處理。但是,對(duì)于超級(jí)長(zhǎng)的Hive SQL語(yǔ)句,開(kāi)發(fā)者想要分析哪個(gè)子段所花費(fèi)的查詢時(shí)間,就很難了。本文圍繞該問(wèn)題出發(fā),自定義Hive SQL Job分析工具,提高Hive查詢性能。
建立HBase的集群和HDInsight在Hadoop中使用Hive來(lái)查詢它們
本文將教你如何使用Hive Hadoop的HBase的表創(chuàng)建和查詢HDInsight。
Hive作為Hadoop家族的重要一員,具有學(xué)習(xí)成本低,開(kāi)發(fā)者可通過(guò)類SQL語(yǔ)句快速實(shí)現(xiàn)簡(jiǎn)單的MapReduce統(tǒng)計(jì),不必開(kāi)發(fā)專門的MapReduce應(yīng)用。本文分享了不少Hive優(yōu)化技巧,值得一讀。
本文主要圍繞以下六方面進(jìn)行詳細(xì)說(shuō)明:1)Hive五種數(shù)據(jù)導(dǎo)入方式有哪些?2)導(dǎo)入表命令中有無(wú)LOCAL關(guān)鍵字的區(qū)別?3)使用OVERWRITE或INTO關(guān)鍵字的作用及區(qū)別?4)INPATH路徑的限制?5)什么是動(dòng)態(tài)分區(qū)插入?6)動(dòng)態(tài)分區(qū)插入需要做哪些設(shè)置?
MapReduce Hive Hbase項(xiàng)目?jī)?yōu)化
充分的利用機(jī)器的性能,更快的完成MapReduce程序的計(jì)算任務(wù)。甚至是在有限的機(jī)器條件下,能夠支持運(yùn)行足夠多的MapReduce程序。
本文詳細(xì)講解了Hive如何將SQL編譯為MapReduce,主要分為哪六個(gè)階段,以及Hive SQL編譯過(guò)程的設(shè)計(jì),非常干貨的一篇文章。
本文使用Hive對(duì)三種不同的文件存儲(chǔ)格式——Text、ORC和Parquet進(jìn)行了對(duì)比測(cè)試,通過(guò)這三種文件存儲(chǔ)格式的測(cè)試對(duì)比,ORC文件存儲(chǔ)格式無(wú)論是在空間存儲(chǔ)、導(dǎo)數(shù)據(jù)速度還是查詢速度上表現(xiàn)的都較好一些,并且ORC可以一定程度上支持ACID操作。
Hive RCFile高效存儲(chǔ)結(jié)構(gòu)
本文介紹了Facebook公司數(shù)據(jù)分析系統(tǒng)中的RCFile存儲(chǔ)結(jié)構(gòu),該結(jié)構(gòu)集行存儲(chǔ)和列存儲(chǔ)的優(yōu)點(diǎn)于一身,在MapReduce環(huán)境下的大規(guī)模數(shù)據(jù)分析中扮演重要角色。