學習并行LINQ的一點總結
我們了解和學習并行LINQ的時候首先來看看LINQ,LINQ(Language Integrated Query)是Visual Studio 2008中的重頭戲,那么什么是并行LINQ呢?下面我們來看看具體的內容。
學習并行LINQ的前期:
借助于LINQ技術,我們可以使用一種類似SQL的語法來查詢任何形式的數據。目前為止LINQ所支持的數據源有SQL Server、XML以及內存中的數據集合。開發人員也可以使用其提供的擴展框架添加更多的數據源,例如MySQL、Amazon甚至是Google Desktop。
一般來講,這類查詢語句的一個重要特點就是可以并行化執行。雖然有些情況下并行可能會帶來一些問題,但這種情況非常少見。這樣也就水到渠成地引出了PLINQ這個并行處理的LINQ類庫。
PLINQ原名為Parallel LINQ,支持XML和內存中的數據集合。執行于遠程服務器上的查詢語句(例如LINQ to SQL)顯然無法實現這個功能。
將LINQ語句轉換為PLINQ語句極為簡單——只需要在查詢語句中From子句所指定的數據源的最后添加.AsParallel()即可。隨后Where、OrderBy和Select子句將自動改為調用這個并行的LINQ版本。
并行LINQ之PLINQ可以以三種方式執行。
第一種是管道處理:一個線程用來讀取數據源,而其他的線程則用來處理查詢語句,二者同步進行——雖然這個單一的消費線程可能并不那么容易與多個生產線程同步。不過若是能夠仔細配置好負載平衡的話,仍然會極大地減少內存占用。
第二種模式叫做“stop and go”,用于處理結果集需要被一次返回時(例如調用ToList、ToArray或對結果排序)的情況。在這種模式下,將依次完成各個處理過程,并將結果統一返回給消費線程。這個模式在性能上將優于第一種模式,因為它省去了用來保持線程同步所花費的開銷。
第三種方法叫做“inverted enumeration”。該方法并不需要實現收集到所有的輸出,然后在單一的線程中處理,而是將最終調用的函數通過ForAll擴展傳遞到每個線程中。 這是目前為止最快的一種處理模式,不過這需要傳遞到ForAll中的函數是線程安全的,且最好不包含任何lock之類的互斥語句。
若是PLINQ中任意的一個線程拋出異常,那么所有的其他線程將會被終止。若是拋出了多個異常,那么這些異常將被組合成一個MultipleFailuresException類型的異常,但每個異常的調用堆棧仍會被保留。
學習并行LINQ的相關內容就向你介紹到這里,希望對你了解和學習學習并行LINQ有所幫助。
【編輯推薦】