大數據基礎知識學習
文件存儲:Hadoop HDFS、Tachyon、KFS
離線計算:Hadoop MapReduce、Spark
流式、實時計算:Storm、Spark Streaming、S4、Heron、Flink
K-V、NOSQL數據庫:HBase、Redis、MongoDB
資源管理:YARN、Mesos
日志收集:Flume、Scribe、Logstash、Kibana
消息系統:Kafka、StormMQ、ZeroMQ、RabbitMQ
查詢分析:Hive、Impala、Pig、Presto、Phoenix、SparkSQL、Drill、分布式協調服務:Zookeeper、Kylin、Druid
集群管理與監控:Ambari、Ganglia、Nagios、Cloudera Manager
數據挖掘、機器學習:Mahout、Spark MLLib
數據同步:Sqoop
任務調度:Oozie
這樣整體之后,對于如何學習是不是有個更明確的路線了呢?
那么個人覺得初步學習的技術應該有以下這些:
HDFS
MapReduce
YARN
SparkStreaming
SparkSQL
Hive
Impala
HBase
Apache Kylin
Flume
參考文章
大數據初步了解?
http://lxw1234.com/archives/2016/11/779.htm
大數據雜談?
http://lxw1234.com/archives/2016/12/823.htm
推薦文章
零基礎學習Hadoop?
http://blog.csdn.net/qazwsxpcm/article/details/78460840
HBase 應用場景?
http://blog.csdn.net/lifuxiangcaohui/article/details/39894265
Hadoop硬件選擇?
http://bigdata.evget.com/post/1969.html
圖解Spark:核心技術與案例實戰?
http://www.cnblogs.com/shishanyuan/category/925085.html
一個大數據項目的架構設計與實施方案?
http://www.360doc.com/content/17/0603/22/22712168_659649698.shtml
相關文檔
Hadoop-10-years?
鏈接:http://pan.baidu.com/s/1nvBppQ5?密碼:7i7m
Hadoop權威指南?
鏈接:http://pan.baidu.com/s/1skJEzj3?密碼:0ryw
Hadoop實戰?
鏈接:http://pan.baidu.com/s/1dEQi29V?密碼:ddc7
Hadoop源代碼分析?
鏈接:http://pan.baidu.com/s/1bp8RTcN?密碼:ju63
Spark最佳學習路徑?
鏈接:http://pan.baidu.com/s/1i5MmJVv?密碼:qfbt
深入理解大數據+大數據處理與編程實踐?
鏈接:http://pan.baidu.com/s/1dFq6OSD?密碼:7ggl