
IP屬地:江西
本文原始地址 分類 每個人每天都會進行很多次的分類操作。比如,當你看到一個陌生人,你的大腦中的分類器就會根據TA的體貌特征、衣著舉止,判斷出TA...
本文原始地址 剖析Spark工作的運行 我們來看下當我們運行一個Spark工作時,會發生什么。在最高級別上,有兩個獨立的實體:驅動(driver...
本文原始地址 Persistence 回到本章開頭的例子,我們可以把“年度-氣溫”的中間數據集緩存在內存中: 調用cache()不會立刻把RDD...
本文原始地址 Resilient Distributed Datasets RDD是每個spark程序的核心,本節我們來看看更多細節。 Crea...
本文原始地址 A Scala Standalone Application 在Spark shell中運行了一個小程序之后,你可能想要把它打包成...
本文翻譯自O'Reilly出版Tom White所著《Hadoop: The Definitive Guide》第4版第19章,向作者致敬。該書...