1、HBase的定義:面向列、可伸縮
HBase數據庫與關系型數據庫的區別
為什么會出現HBase?
什么場景下使用HBase?
2、HBase核心概念:namespace table columnfamily rowkey qualifier timestamp cell
3、HBase shell基本語法:創建表 掃描 清空 刪除
4、HBase架構:Master Regionserver ?region zookeeper?
5、Hadoop集群運行腳本之間的關系
6、HBase的讀寫流程
7、HBase的javaAPI:增刪改查
查:除了前綴匹配的過濾器、還有很多其他的過濾器
8、HBase與MapReduce整合,HBase與Hive整合
使用命令把文件導入HBase
9、HBase底層的文件格式:HFile--DataBlock key-value 為了方便我們去設計表
10、表的設計:
1)應用場景(數據量大、場景簡單、查詢條件固定化)
2)預分region 要進行測試
3)rowkey的設計 長度原則(最好是8的倍數)、唯一、分散(hash算法)
11、常用命令:
tools 大合并 小合并
table屬性 壓縮格式 學會編譯開源軟件 ?壓縮格式之間的區別
文件格式:列式的文件格式
blockcache in memory=false的作用