Scala中的for表達式:枚舉的“瑞士軍刀”
Scala的for表達式是為枚舉準備的“瑞士軍刀”。它可以讓你用不同的方式把若干簡單的成分組合來表達各種各樣的枚舉。簡單的用法完成如把整數序列枚舉一遍那樣通常的任務。更高級的表達式可以列舉不同類型的多個集合,可以用任意條件過濾元素,還可以制造新的集合。
51CTO編輯推薦:Scala編程語言專題
枚舉集合類
你能用for做的最簡單的事情就是把一個集合類的所有元素都枚舉一遍。如,代碼7.5展示了打印當前目錄所有文件名的例子。I/O操作使用了Java的API。首先,我們創建指向當前目錄,".",的文件,然后調用它的listFiles方法。方法返回File對象數組,每個都代表當前目錄包含的目錄或文件。我們把結果數組保存在filesHere變量。
代碼 7.5 用for循環列表目錄中的文件
- val filesHere = (new java.io.File(".")).listFiles
- for (file < - filesHere)
- println(file)
通過使用被稱為發生器:generator的語法“file < - filesHere”,我們遍歷了filesHere的元素。每一次枚舉,名為file的新的val就被元素值初始化。編譯器推斷file的類型是File,因為filesHere是Array[File]。對于每一次枚舉,for表達式的函數體,println(file),將被執行一次。由于File的toString方法產生文件或目錄的名稱,因此當前目錄的所有文件和目錄的名稱都會被打印出來。
for表達式語法對任何種類的集合類都有效,而不只是數組。更精確地說,在<-符號右側的表達式必須支持名為foreach的方法。第80頁的表格5-4中看到的Range類型是其中一個方便的特例,你可以使用類似于“1 to 5”這樣的語法創建一個Range,然后用for枚舉。以下是一個簡單的例子:
如果你不想包括被枚舉的Range的上邊界,可以用until替代to:
- scala> for (i < - 1 to 4)
- println("Iteration " + i)
- Iteration 1
- Iteration 2
- Iteration 3
- Iteration 4
像這樣枚舉整數在Scala里是很平常的,但在其他語言中就不是這么回事。其它語言中,你或許要采用如下方式遍歷數組:
- scala> for (i < - 1 until 4)
- println("Iteration " + i)
- Iteration 1
- Iteration 2
- Iteration 3
- // Scala中不常見……
- for (i < - 0 to filesHere.length - 1)
- println(filesHere(i))
這個for表達式引入了變量i,依次把它設成從0到filesHere.length - 1的整數值,然后對i的每個設置執行一次for表達式的循環體。對應于每一個i的值,filesHere的第i個元素被取出并處理。
這種類型的枚舉在Scala里不常見的原因是直接枚舉集合類也做得同樣好。這樣做,你的代碼變得更短并規避了許多枚舉數組時頻繁出現的超位溢出:off-by-one error。該從0開始還是從1開始?應該加-1,+1,還是什么都不用直到最后一個索引?這些問題很容易回答,但也很容易答錯。還是避免碰到為佳。
過濾
有些時候你不想枚舉一個集合類的全部元素。而是想過濾出一個子集。你可以通過把過濾器:filter:一個if子句加到for的括號里做到。如代碼7.6的代碼僅對當前目錄中以“.scala”結尾的文件名做列表:
- val filesHere = (new java.io.File(".")).listFiles
- for (file < - filesHere if file.getName.endsWith(".scala"))
- println(file)
代碼 7.6 用帶過濾器的for發現.scala文件
或者你也可以這么寫:
- for (file < - filesHere)
- if (file.getName.endsWith(".scala"))
- println(file)
這段代碼可以產生與前一段代碼同樣的輸出,而且對于指令式背景的程序員來說看上去更熟悉一些。然而指令式格式只是一個可選項,因為這個for表達式的運用執行的目的是為了它的打印這個副作用并產生unit值()。正如在本節后面將展示的,for表達式之所以被稱為“表達式”是因為它能產生令人感興趣的值,一個其類型取決于for表達式< -子句的集合。
如果愿意的話,你可以包含更多的過濾器。只要不斷加到子句里即可。例如,為了加強防衛,代碼7.7中的代碼僅僅打印文件而不是目錄。通過增加過濾器檢查file的isFile方法做到:
- for (
- file < - filesHere
- if file.isFile;
- if file.getName.endsWith(".scala")
- ) println(file)
代碼 7.7 在for表達式中使用多個過濾器
注意
如果在發生器中加入超過一個過濾器,if子句必須用分號分隔。這是代碼7.7中的“if file.isFile”過濾器之后帶著分號的原因。
嵌套枚舉
如果加入多個< -子句,你就得到了嵌套的“循環”。比如,代碼7.8展示的for表達式有兩個嵌套循環。外層的循環枚舉filesHere,內層的枚舉所有以.scala結尾文件的fileLines(file)。
- def fileLines(file: java.io.File) =
- scala.io.Source.fromFile(file).getLines.toList
- def grep(pattern: String) =
- for {
- file < - filesHere
- if file.getName.endsWith(".scala")
- line < - fileLines(file)
- if line.trim.matches(pattern)
- } println(file + ": " + line.trim)
- grep(".*gcd.*")
代碼 7.8 在for表達式中使用多個發生器
如果愿意的話,你可以使用大括號代替小括號環繞發生器和過濾器。使用大括號的一個好處是你可以省略一些使用小括號必須加的分號。
mid-stream(流間)變量綁定
請注意前面的代碼段中重復出現的表達式line.trim。這不是個可忽略的計算,因此你或許想每次只算一遍。通過用等號(=)把結果綁定到新變量可以做到這點。綁定的變量被當作val引入和使用,不過不用帶關鍵字val。代碼7.9展示了一個例子。
- def grep(pattern: String) =
- for {
- file < - filesHere
- if file.getName.endsWith(".scala")
- line < - fileLines(file)
- trimmed = line.trim
- if trimmed.matches(pattern)
- } println(file + ": " + trimmed)
- grep(".*gcd.*")
代碼 7.9 在for表達式里的流間賦值
代碼中,名為trimmed的變量被從半當中引入for表達式,并被初始化為line.trim的結果值。之后的for表達式就可以在兩個地方使用這個新變量,一次在if中,一次在println中。
制造新集合
到現在為止所有的例子都只是對枚舉值進行操作然后就放過,除此之外,你還可以創建一個值去記住每一次的迭代。只要在for表達式之前加上關鍵字yield。比如,下面的函數鑒別出.scala文件并保存在數組里:
- def scalaFiles =
- for {
- file < - filesHere
- if file.getName.endsWith(".scala")
- } yield file
for表達式在每次執行的時候都會制造一個值,本例中是file。當for表達式完成的時候,結果將是一個包含了所有產生的值的集合。結果集合的類型基于枚舉子句處理的集合類型。本例中結果為Array[File],因為filesHere是數組并且產生的表達式類型是File。
另外,請注意放置yield關鍵字的地方。對于for-yield表達式的語法是這樣的:
- for {子句} yield {循環體}
yield在整個循環體之前。即使循環體是一個被大括號包圍的代碼塊,也一定把yield放在左括號之前,而不是代碼塊的最后一個表達式之前。請抵擋住寫成如下方式的誘惑:
- for (file < -filesHere if file.getName.endsWith(".scala")) {
- yield file // 語法錯誤!
- }
例如,代碼7.10展示的for表達式首先把包含了所有當前目錄的文件的名為filesHere的Array[File],轉換成一個僅包含.scala文件的數組。對于每一個對象,產生一個Iterator[String](fileLines方法的結果,定義展示在代碼7.8中),提供方法next和hasNext讓你枚舉集合的每個元素。這個原始的枚舉器又被轉換為另一個Iterator[String]僅包含含有子字串"for"的修剪過的行。最終,對每一行產生整數長度。這個for表達式的結果就是一個包含了這些長度的Array[Int]數組。
- val forLineLengths =
- for {
- file < - filesHere
- if file.getName.endsWith(".scala")
- line < - fileLines(file)
- trimmed = line.trim
- if trimmed.matches(".*for.*")
- } yield trimmed.length
代碼 7.10 用for把Array[File]轉換為Array[Int]
【相關閱讀】