
Kafka的基本概念 BrokerKafka集群中包含多個服務器,其中每個服務器稱為一個broker。有一點需要注意一下,添加一個新的broke...
1.1 介紹 GBDT = Gradient Boosting + Decision TreeGradient Boosting = Gradi...
監督學習基本元素 模型 參數 目標函數 = 損失函數+正則化項:優化損失函數為了擬合預測模型,而正則項負責簡化模型,提高模型的泛化能力Snipa...
CAP分布式理論 2002年CAP理論正式成為分布式計算領域的公認定理 CAP指一致性(Consisitency),可用性(Avaliabili...
本文從類七個階段更加high Level的角度去解析一下類的加載過程。Java字節碼的表現形式是字節數組,而java類在jvm中的表現是java...
類的加載過程概況 類從被加載到虛擬機內存開始,直到卸載出內存,它的生命周期包含了:加載,驗證,準備,解析,初始化,使用和卸載7個階段。 其中,加...
大家都知道spark的計算是基于內存的,所以內存的合理使用對spark調優至關重要,其實大方向主要關注三個方面CPU,網絡帶寬,內存。下文主要覆...
概況 spark提供了一些方案來調度資源。首先,每個spark程序都在跑在若干個獨立的executor集群上的(其中executor是一個jvm...
起源 spark提供了一種根據負載動態調整資源的的方式,意味著你的程序可以將閑置的資源釋放和添加需要的資源。對多個程序共享一塊資源是非常有意義的...