
1、環境描述 jdk:jdk1.8.0_45 maven:3.3.9 hadoop:2.6.0-cdh5.14.0 其他:因為前期編譯過hado...
該文章說的清晰明了,好文,贊一個! Apache Spark 統一內存管理模型詳解 – 過往記憶
1、簡介 RDD(Resilient Distributed Dataset)叫做彈性分布式數據集,是Spark中最基本的數據抽象,它代表一個不...
spark簡介: Spark學習之路 (一)Spark初識 - 扎心了,老鐵 - 博客園 1、下載 地址:http://spark.apache...
1、broker 其實就是kafka的進程,代表kafka的一個節點 2、topic 其實就是對消息的分門別類進行存儲,寫的時候需要指定 3、生...
kafka運行需要zookeeper、scala2.11、jdk支撐 版本:kafka_2.11-0.10.0.1.tgz(2.11指的是sca...
hive的壓縮本質上指的是MapReduce的壓縮,因為hive其實就是MapReduce的高級語言版(SQL),hive SQL底層的運行也都...
原生API: package com.ruozedata.zookeeperimport org.apache.zookeeper.Watche...
hue的HA模式和非HA模式配置略有差別 安裝: HUE安裝及問題 - CSDN博客 hue 安裝筆記 - CSDN博客 問題: 安裝Hue后的...