【Scala】模式匹配和樣本類

模式匹配

要理解模式匹配(pattern-matching),先把這兩個單詞拆開,先理解什么是模式(pattern),這里所的模式是數據結構上的,這個模式用于描述一個結構的組成。

我們很容易聯想到“正則表達”里的模式,不錯,這個pattern和正則里的pattern相似,不過適用范圍更廣,可以針對各種類型的數據結構,不像正則表達只是針對字符串。比如正則表達式里 "^A.*" 這個pattern 表示以A開頭、后續一個或多個字符組成的字符串;List("A", _, _*) 也是個pattern,表示第一個元素是”A”,后續一個或多個元素的List。

match表達式的不同

match表達式可以看做是Java風格switch的泛化。當每個模式都是常量并且最后一個模式可以是通配的時候,Java風格的switch可以被自然地表達為match表達式。但有三點不同需要牢記:

1. match表達式始終以值作為結果,這是Scala表達式的特點
2. Scala的備選項表達式永遠不會意外掉入到下一個分支。在C或其他類C語言中,每個分支末尾要顯式使用break語句來退出switch。
3. 如果沒有模式匹配,MatchError異常會被拋出。這意味著你必須始終確信所有的情況都考慮到,或者至少意味著可以添加一個默認情況什么事都不做

模式的種類

1、通配模式(_)匹配任意對象,它被用作默認的“全匹配(catch-all)”的備選項
2、常量模型僅匹配自身,任何字面量都可以用作常量
3、變量模式類似于通配模式,它可以匹配任意對象。與通配符(_)不同的是,Scala把變量綁定在匹配的對象上。

//這里,如果expr非零
//somethingElse變量將綁定對象expr,結果輸出expr的值
expr match {
    case 0 => "zero"
    case somethingElse => "not zero: " + somethingElse
}

4、構造器模式提供了深度匹配(deep match),如果備選項是樣本類,那么構造器模式首先檢查對象是否為該備選項的樣本類實例,然后檢查對象的構造器參數是否符合額外提供的模式。
構造器模式不只檢查頂層對象是否一致,還會檢查對象的內容是否匹配內層的模式。由于額外的模式自身可以形成構造器模式,因此可以使用它們檢查到對象內部的任意深度。

//某個商店售賣物品,有時物品捆綁在一起打折出售
abstract class Item
case class Product(description: String, price: Double) extends Item
case class Bundle(description: String, discount: Double, items: Item*) extends Item

def price(it: Item): Double = it match {
  case Product(_, p) => p
  case Bundle(_, disc, its @ _*) => its.map(price _).sum * (100-disc) /100
  //這里@表示將嵌套的值綁定到變量its
}


//測試
val bun1 = Bundle("Father's day special", 20.0, Product("Massager", 188.0))
val bun2 = Bundle("Appliances on sale", 10.0, Product("Haier Refrigerato, 3000.0),
                                               Product("Geli air conditionor",2000.0))

//商品組合1 八折結果
scala> price(bun1)
res5: Double = 150.4
//商品組合2 九折結果
scala> price(bun2)
res6: Double = 4500.0

5、序列模式可以像匹配樣本類那樣匹配如List或者Array這樣的序列類型。

expr match {
    case List(0, _, _) => println("found it")
    case _ =>
}

//匹配不定長序列
expr match {
    case List(0, _*) => println("found it")
    case _ => 
}

6、元組模式匹配元祖
7、類型模式可以當做類型測試和類型轉換的簡易替代。

scala> def generalSize(x: Any) = x match {
     |   case s: String => s.length
     |   case m: Map[_, _] => m.size
     |   case _ => 1
     | }
generalSize: (x: Any)Int

scala> generalSize("abc")
res7: Int = 3

scala> generalSize(Map(1 -> 'a', 2 -> 'b'))
res8: Int = 2

scala> generalSize(Math.PI)
res9: Int = 1

樣本類

帶有case修飾符的類稱為樣本類(case class)。這種修飾符可以讓Scala編譯器自動為你的類添加一些句法上的便捷性。

  1. 樣本類會添加與類名一致的工廠方法。你不用new關鍵字就可以創建這個類。
  1. 樣本類參數列表中的所有參數隱式獲得val前綴,因此它被當做字段維護。
  2. 編譯器為樣本類添加了方法toString、hashCode和equals的實現。

這些便捷性的代價就是必須寫case修飾符并且樣本類和對象都因為附加的方法及對于每個構造器參數添加了隱含的字段而變得大了一點。
樣本類是一種特殊的類,它經過優化以被用于模式匹配。

封閉類

封閉類除了類定義所在的文件之外不能再添加任何新的子類。其用于模式匹配的另外一個作用是,當你用樣本類來做模式匹配是,你可能想讓編譯器幫你確保你已經列出了所有可能的選擇。為了達到這個目的,你需要將樣本類的通用超類聲明為sealed。如果你使用繼承自封閉類的樣本類做匹配,編譯器將通過通知警告信息標識出缺失的模式組合。
舉個例子:

sealed abstract class Amount

case class Dollar(value: Double) extends Amount
case class Euro(value: Double) extends Amount
case class Currency(value: Double, unit: String) extends Amount

def describe(a: Amount): String = a match {
    case Dollar(_) => "Dollar"
    case Euro(_) => "Euro"
}

//這里會出現編譯器警告
//warning: match may not be exhaustive.
//It would fail on the following input: Currency(_, _)
//       def describe(a: Amount): String = a match {
//                                         ^
//describe: (a: Amount)String

如果想要讓編譯器不進行警告提示的話,需要給匹配的選擇器表達式添加@unchecked注解。
像是這樣def describe(a: Amount): String = (a: @unchecked) match {
如果某個類是封閉的,那么在編譯器所有子類就是可知的,因而編譯器可以檢查模式語句的完整性。讓所有(同一組)樣本類都擴展某個封閉類或特質是個好的做法。

Option類型

標準類庫中的Option類型用樣本類來表示那種可能存在、也可能不存在的值??梢允荢ome(value)的形式,其中value是實際的值;也可以是None對象,代表缺失的值。
Scala集合類的某些標準操作會產生可選值。例如Scala的Map的get方法會發現了指定鍵的情況下產生Some(value),在沒有找到指定鍵的時候產生None。
舉例如下:

scala> val capitals = Map("France" -> "Paris",
     | "Japan" -> "Tokyo", "China" -> "Beijing")
capitals: scala.collection.immutable.Map[String,String] = Map(France -> Paris, Japan -> Tokyo, China -> Beijing)

scala> capitals get "France"
res2: Option[String] = Some(Paris)

scala> capitals get "North Pole"
res3: Option[String] = None

樣本類None的形式比空字符串的意圖更加清晰,比使用null來表示缺少某值的做法更加安全。
Option支持泛型。舉例來說,Some(Paris)的類型為Option[String]。

分離可選值最通用的辦法是通過模式匹配的方式,舉例如下:

scala> def showCapital(x: Option[String]) = x match {
     |   case Some(s) => s
     |   case None => "?"
     | }
showCapital: (x: Option[String])String

scala> showCapital(capitals get "Japan")
res5: String = Tokyo

scala> showCapital(capitals get "France")
res6: String = Paris

scala> showCapital(capitals get "China")
res7: String = Beijing

scala> showCapital(capitals get "North Pole")
res8: String = ?

Scala鼓勵對Option的使用以說明值是可選的。這種處理可選值的方式有若干超越Java的優點。

Option[String]類型的變量是可選的String,這比String類型的變量或可能有時是null來說更加明顯
使用可能為null而沒有檢查是否為null的變量產生的編程錯誤在Scala里變為類型錯誤,即如果變量是Option[String]類型的,而你打算當做String使用,這樣不會編譯通過。

參考資料

話說模式匹配(1): 什么是模式?

轉載請注明作者Jason Ding及其出處
GitCafe博客主頁(http://jasonding1354.gitcafe.io/)
Github博客主頁(http://jasonding1354.github.io/)
CSDN博客(http://blog.csdn.net/jasonding1354)
簡書主頁(http://www.lxweimin.com/users/2bd9b48f6ea8/latest_articles)
Google搜索jasonding1354進入我的博客主頁

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容