關于Spark 及 Hadoop 開發員培訓的通知

Spark 及 Hadoop開發員培訓將學習如何將數據導入到 Apache Hadoop 機群并使用 Spark、Hive、Flume、Sqoop、Impala 及其他 Hadoop 生態系統工具對數據進行各種操作和處理分析。Spark 及 Hadoop 開發員培訓將于2017-03-16召開,期間活動家將為您帶來更多的Spark 及 Hadoop 開發員培訓資訊和最安全的報名通道:

https://www.huodongjia.com/event-661863863.html

培訓概況

在為期四天的培訓中,學員將學習關鍵概念和掌握使用最新技術和工具將數據采集到 Hadoop 機群并進行處理。通過學習掌握諸如 Spark、Hive、Flume、Sqoop 和 Impala 這樣的 Hadoop 生態系統工具和技術,Hadoop 開發員將具備解決實際大數據問題和挑戰的能力。本課程包含了大量的實操及編程練習來幫助學員熟悉并掌握各種工具,并最終獲得在實際工作中針對特定的問題或場景來選取最佳解決工具或技術的能力。

培訓內容

通過講師在課堂上的講解,以及實操練習,學員將學習 Apache Spark 及如何將其集成到整個 Hadoop 生態系統中去,包括以下內容:

數據是如何在 Hadoop 機群里進行分布式存儲及處理的

如何使用 Sqoop 和 Flume 導入數據

如何使用 Apache Spark 處理分布式數據

如何使用 Impala 及 Hive 將結構化數據建模成表并進行分析查詢

如何根據數據使用場景來確定最佳存儲格式

數據存儲最佳實踐

培訓對象及學員基礎

本課程適合準備報考 CCA Spark 及 Hadoop 開發員認證考試的技術人員。雖然通過該認證考試,考生仍然需要做進一步的學習和準備,但是本課程涵蓋了在該認證考試中考核的很多主題和知識點。

在參加完本培訓后,我們建議學員參加此課程的一個后繼課程:“設計和創建大數據應用”

課程介紹

Hadoop 及生態系統介紹

傳統大規模系統的問題

Hadoop !

Hadoop 生態系統

Hadoop 體系結構及 HDFS

機群環境下的分布式處理

存儲:HDFS 體系結構

存儲:使用 HDFS

資源管理:YARN 體系結構

資源管理:使用 YARN

使用 Apache Sqoop 導入關系數據

Sqoop 簡介

數據的基本導入導出

減少傳輸的數據量

改善 Sqoop 性能

Sqoop 2

……

為了簡化報名流程,Spark 及 Hadoop 開發員培訓已開通網上購票系統,您可登陸活動家網站進行峰會報名!

快捷報名地址:https://www.huodongjia.com/event-661863863.html

?

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容