1、scala 語言有什么特點,相比java有什么優(yōu)點?
3、spark有什么特點,處理大數(shù)據(jù)有什么優(yōu)勢?
4、Spark技術棧有哪些組件,每個組件都有什么功能,適合什么應用場景?
5、Apache Spark有哪些常見的穩(wěn)定版本,Spark1.6.0的數(shù)字分別代表什么意思?
6、Mapreduce和Spark有什么區(qū)別與聯(lián)系?
7、簡單說一下hadoop和spark的shuffle相同和差異?
17、RDD中reduceBykey與groupByKey哪個性能好,為什么?
18、spark streming在實時處理時會發(fā)生什么故障,如何停止,解決?
19、spark streaming 讀取kafka數(shù)據(jù)的兩種方式?
21、如何解決spark中的數(shù)據(jù)傾斜問題?
22、spark中的數(shù)據(jù)傾斜的現(xiàn)象、原因、后果?
?
29、Spark master HA 主從切換過程不會影響集群已有的作業(yè)運行,為什么?
30、Spark master使用zookeeper進行HA的,有哪些元數(shù)據(jù)保存在Zookeeper?
31、Spark master HA 主從切換過程不會影響集群已有的作業(yè)運行,為什么?
32、Spark master使用zookeeper進行HA的,有哪些元數(shù)據(jù)保存在Zookeeper?