深入探討C#foreach語句
C# foreach語句不僅僅只是do...while或者for循環語句的一個變體。它會為我們的集合產生***的遍歷代碼。實際上,foreach語句的定義和.NET框架中的集合接口密切相關。對于一些特殊的集合類型,C#編譯器會產生具有***效率的代碼。遍歷集合時,我們應該使用C# foreach語句,而非其他的循環構造。例如,對于下面三種循環:
- int [] foo = new int[100];
- // 循環1:
- foreach ( int i in foo)
- Console.WriteLine( i.ToString( ));
- // 循環2:
- for ( int index = 0;
- index < foo.Length;
- index++ )
- Console.WriteLine( foo[index].ToString( ));
- // 循環3:
- int len = foo.Length;
- for ( int index = 0;
- index < len;
- index++ )
- Console.WriteLine( foo[index].ToString( ));
對于當前和將來的C#編譯器(版本1.1及其以上版本),第1個循環產生的代碼***,而且需要鍵入的字符也最少,因此程序員的開發效率也比較高。(不過在C# 1.0編譯器下,第1個循環產生的代碼效率較慢,第2個循環產生的代碼效率***。)大多數C和C++程序員認為效率***的第3循環,反而是最壞的選擇。通過將Length變量放到循環之外,我們實際上阻礙了JIT編譯器移除循環中的范圍檢查。
C#代碼運行在一個安全、托管的環境中。每一個內存位置都會被檢查,包括數組索引。事實上,第3個循環所產生的代碼和如下的代碼等效:
- // 循環3, 和編譯器產生的代碼等效:
- int len = foo.Length;
- for ( int index = 0;
- index < len;
- index++ )
- {
- if ( index < foo.Length )
- Console.WriteLine( foo[index].ToString( ));
- else
- throw new IndexOutOfRangeException( );
- }
JIT和C#編譯器并不“喜歡”我們用這種方式來幫助它們。將Length屬性放到循環之外只會讓JIT編譯器做更多的工作,產生的代碼也更慢。CLR會確保我們寫的代碼不會濫用變量擁有的內存。CLR會在訪問每一個特定數組元素之前,產生一個數組界限(并非上面的len變量)測試。如果我們像上面那樣寫代碼,每一個數組界限測試會被執行兩次。
在循環的每一次迭代中,我們都要對數組索引做兩次檢查。第1個循環和第2個循環更快的理由在于C#編譯器和JIT編譯器可以確保循環中的數組界限是安全的。只要循環變量不是數組的Length屬性,每一次迭代時都會執行數組界限檢查。
對于1.0版本的C#編譯器,在數組上使用foreach語句產生的代碼比較慢的原因在于裝箱操作(有關裝箱的詳細討論,參見條款17)。在.NET中,數組是類型安全的。1.1版本之后的C#編譯器會為數組與其他集合產生不同的IL。在1.0版本的編譯器產生的代碼中,在數組上使用foreach語句實際上是通過IEnumerator接口來遍歷數組,而這會導致裝箱與拆箱操作:
- IEnumerator it = foo.GetEnumerator( );
- while( it.MoveNext( ))
- {
- int i = (int) it.Current; // 這里將出現裝箱和拆箱。
- Console.WriteLine( i.ToString( ) );
- }
相反,對于1.1版本之后的C#編譯器,在數組上使用foreach語句將產生類似如下的構造:
- for ( int index = 0;
- index < foo.Length;
- index++ )
- Console.WriteLine( foo[index].ToString( ));
由于foreach語句總會產生***的代碼,所以我們不必刻意去記憶哪種構造會產生***效的循環構造——foreach和編譯器會為我們做這些工作。
如果效率還不能說服大家,那么來看看語言互操作的情況。總有一些人(其中的大多數人都有使用其他一些編程語言的經驗)堅定地認為數組的起始索引變量應該從1(而非0)開始。不管我們怎么費力地說服他們,都無法改變他們的這個習慣。.NET開發組在這個問題上已經盡力了。我們可以在C#語言中用如下的初始化方式,來獲得一個起始索引不為0的數組:
- // 創建一個一維數組,范圍為 [ 1 .. 5 ]。
- Array test = Array.CreateInstance( typeof( int ),
- new int[ ]{ 5 }, new int[ ]{ 1 });
很多人面對這樣的代碼可能會退縮,轉而使用起始索引為0的數組。但是總有一些人對此比較頑固。不管你怎么努力,這些人都會堅持從1開始索引數組。幸運地是,在這個問題上我們可以使用foreach語句來蒙混編譯器:
- foreach( int j in test )
- Console.WriteLine ( j );
這里的foreach語句知道如何獲得數組的上下界,因此就不必煩勞我們——而且其效率和我們手寫的for循環一樣快,不管其他人采用的數組下界是多少,我們使用這種做法都可以正常工作。
另外,C# foreach語句還可以為我們帶來其他好處。其中的循環變量是只讀的——也就是說我們不能替換foreach語句中的集合對象。而且還存在一個顯式強制轉型。如果集合中保存的對象類型不正確,迭代語句將拋出一個異常。
對于多維數組,foreach語句也有類似的好處。假設我們要創建一個棋盤,我們可能會編寫如下的兩段代碼:
- private Square[,] _theBoard = new Square[ 8, 8 ];
- // 另外地方的代碼:
- for ( int i = 0; i < _theBoard.GetLength( 0 ); i++ )
- for( int j = 0; j < _theBoard.GetLength( 1 ); j++ )
- _theBoard[ i, j ].PaintSquare( );
使用foreach語句,我們可以將上面的遍歷代碼做如下的簡化:
- foreach( Square sq in _theBoard )
- sq.PaintSquare( );
不管數組的維數是多少,foreach語句都會產生正確的遍歷代碼。如果我們之后又要做一個3D棋盤,上面的foreach循環仍然會正常工作。而其他手寫的循環代碼就需要更改了:
- for ( int i = 0; i < _theBoard.GetLength( 0 ); i++ )
- for( int j = 0; j < _theBoard.GetLength( 1 ); j++ )
- for( int k = 0; k < _theBoard.GetLength( 2 ); k++ )
- _theBoard[ i, j, k ].PaintSquare( );
事實上,對于在每一維上擁有不同下界的多維數組來講,foreach循環也會正常工作。這里我就不再編寫這樣的示例代碼了。如果有人使用那樣的集合,我們要知道foreach語句也能處理它。
如果我們剛開始使用的是數組,后來又需要轉向其他數據結構,foreach語句允許我們不用更改絕大多數代碼,從而保持代碼的靈活性。假設我們剛開始有如下一個簡單的數組:
- int [] foo = new int[100];
但過了一段時間后,我們發現該數組無法方便地處理我們需要的某種功能。這時候,我們選擇將數組更改為ArrayList:
- // 設置初始大小:
- ArrayList foo = new ArrayList( 100 );
這樣更改之后,任何手寫的for循環代碼都將遭到破壞:
- int sum = 0;
- for ( int index = 0;
- // 下面的代碼將不能編譯:ArrayList 使用Count,而非Length。
- index < foo.Length;
- index++ )
- //下面的代碼將不能編譯:foo[ index ] 是一個object,而非int。
- sum += foo[ index ];
而使用foreach語句,它會編譯為不同的代碼,自動將每一個操作數強制轉換為正確的類型。我們在代碼上無需做任何更改。事實上,使用foreach語句不僅可以更改為標準集合類型——任何集合類型都可以使用foreach。
如果我們支持.NET環境為集合所定義的規則,用戶便可以使用foreach來遍歷我們的類型成員。要讓foreach語句將一個類看做集合類型,該類必須擁有一些屬性。總共有3種方式可以使一個類成為集合類:類型具備一個公有的GetEnumerator()方法;類型顯式實現了IEnumerable接口;類型實現了IEnumerator接口。
***,C# foreach語句還會為我們在資源管理方面帶來額外的好處。IEnumerable接口只包含一個方法:GetEnumerator()。在一個支持IEnumerable接口的類型上使用foreach語句會產生類似如下的代碼(會有一些優化):
- IEnumerator it = foo.GetEnumerator( ) as IEnumerator;
- using ( IDisposable disp = it as IDisposable )
- {
- while ( it.MoveNext( ))
- {
- int elem = ( int ) it.Current;
- sum += elem;
- }
- }
如果編譯器可以確定類型對IDisposable接口的實現情況,那么它就會自動優化finally塊中的語句。
綜上所述,foreach是一個非常有用的語句。它會使用***效的構造為“數組的上下界索引”、“多維數組遍歷”和“操作數轉型”產生正確的代碼,并且產生的是***效率的循環結構。它是遍歷集合的***方式。使用它,我們編寫的代碼將比較“經久耐用”,而且在剛開始編寫的時候也比較簡單。使用foreach為我們帶來的開發效率提升可能很少,但是隨著時間的推移,它的效益會不斷增長。
C# foreach語句的深入了解的內容就向你介紹到這里,希望對你了解和學習C# foreach語句有所幫助。
【編輯推薦】