scala特性

為了能用scala開發spark,簡單的介紹一下scala特性.scala即面向對象編程,也同時面向方法編程,也可以說是面向容器編程,在編譯階段會把scala代碼編譯成java字節碼,運行于jvm上.

在這里要介紹閉包,迭代器,隱式函數,因為這幾個特性在開發spark,或者查看源碼的時候,都會經常遇到的. 代碼列子

閉包

定義:
閉包是一個函數,返回值依賴于聲明在函數外部的一個或多個變量。
閉包通常來講可以簡單的認為是可以訪問一個函數里面局部變量的另外一個函數.
我先介紹scala單機閉包.

def main(args: Array[String]) {
    closure1
    println("-----------------")
    closure2
}

def closure2(): Unit ={
val fs = new Array[()=>Int](4)
def set(i:Int) { fs(i) = () => i }
var j = 0
while(j < 4) {set(j); j=j+1}
fs.foreach( f => println(f()))
}


def closure1(): Unit ={
val fs = new Array[()=>Int](4)
var i = 0
while(i < 4)  { fs(i) = () => i; i=i+1}
fs.foreach( f => println(f()))
}
//輸出
4
4
4
4
-----------------
0
1
2
3

可以看出閉包的綁定的是變量的引用,或者是地址. 所以說closure1輸出都是4,當fs.foreach的時候i=4. closure2中傳入set函數,是重新生成一個變量i.
scala閉包到spark分布式計算是如何展現的.我舉個例子就明白了.

val spark = SparkSession
      .builder()
     // .master("local[*]")
      .appName("hello world")
      .config("spark.some.config.option", "some-value")
      .getOrCreate()
val rdd = spark.sparkContext.parallelize(Seq(1,3,4,5,6,1000,10))
var counter = 0
rdd.foreach(x => counter += x)
println("result " + counter)

結果會是多少,1033? 實際輸出0

rdd.foreach是一個分布式操作,counter+=x操作可能在多個jvm中進行,假設有兩個executor,在driver,executor1,executor2中都會有counter,初始化值都為0,相互不干擾. 因為foreach操作都是在executor上進行的,driver中并沒有操作,所以counter還是0

迭代器

scala其實也是面向集合編程的,萬物皆集合.你會發現對象都會有map,foreach,flatMap等.Iterator并不是集合,但是操作集合的方法. 了解它,你就會更加了解scala的集合和spark RDD的底層實現.
舉個例子:

val it =  Iterator[String]("name1","name2","name3")

def rename(name:String): String  ={
  println(name)
  name+"1"
}
//并未實際執行rename
val it2  = it.map(name=>rename(name))
it2.foreach(name=>{
  println(name)
})
如果是存儲至mysql或者外部的數據庫,foreach可以控制每1000條處理寫入一次.

你認為輸出結果?
name1
name2
name3
name11
name21
name31

實際輸出結果:
name1
name11
name2
name21
name3
name31

以下是scala Iterator map實現原理,其實就是重新定義next函數. spark也是基于此原來來實現懶處理的

/** Creates a new iterator that maps all produced values of this iterator
*  to new values using a transformation function.
*
*  @param f  the transformation function
*  @return a new iterator which transforms every value produced by this
*          iterator by applying the function `f` to it.
*  @note   Reuse: $consumesAndProducesIterator
*/
def map[B](f: A => B): Iterator[B] = new AbstractIterator[B] {
def hasNext = self.hasNext
def next() = f(self.next())
}

隱式函數

我們經常引入第三方庫,但當我們想要擴展新功能的時候通常是很不方便的,因為我們不能直接修改其代碼。scala提供了隱式轉換機制和隱式參數幫我們解決諸如這樣的問題。
Scala中的隱式轉換是一種非常強大的代碼查找機制。當函數、構造器調用缺少參數或者某一實例調用了其他類型的方法導致編譯不通過時,編譯器會嘗試搜索一些特定的區域,嘗試使編譯通過.

假設有這樣一個類,如果你想在它上面添加eat方法,你會怎么做?

class People{

  var state:String = "walking"

  def doSomething(): Unit ={
    println(s"i'm $state")
  }
}

如果java做起來,可能比較麻煩,當然可以把在源碼基礎上改。但是一個是違反java的設計原則,一個使用起來比較麻煩.介紹一下scala可以怎么實現:

class PeopleFunction(people: People){

  def eat(): Unit ={
    people.state = "eating"
    people.doSomething()
  }

}
package object action {

  implicit def peopleImpl(people: People): PeopleFunction ={
    new PeopleFunction(people)
  }

}
//main函數
val people = new People
people.eat()

這樣就可以實現了,在編譯階段,會自動把eat函數的字節碼,寫入people中,這樣實現就非常簡單.

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 230,431評論 6 544
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 99,637評論 3 429
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 178,555評論 0 383
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,900評論 1 318
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 72,629評論 6 412
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,976評論 1 328
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,976評論 3 448
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 43,139評論 0 290
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,686評論 1 336
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 41,411評論 3 358
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,641評論 1 374
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 39,129評論 5 364
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,820評論 3 350
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 35,233評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,567評論 1 295
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 52,362評論 3 400
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,604評論 2 380