成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

C#中大數據列表的并行處理技術詳解

大數據
在實際應用中,建議先進行性能測試,根據數據量大小和處理復雜度選擇合適的實現方式。同時要注意異常處理和資源管理,確保程序的穩定性和可靠性。

在處理大型數據集時,單線程處理往往效率低下。通過將數據分割成多個小塊并利用多線程并行處理,我們可以顯著提高程序的性能。本文將詳細介紹幾種實現方式。

使用Parallel.ForEach進行并行處理

最簡單的實現方式是使用C#內置的Parallel.ForEach方法。

namespace AppParallel
{
    internal class Program
    {
        static object lockObject = new object();
        static void Main(string[] args)
        {
            // 創建示例數據
            var largeList = Enumerable.Range(1, 1000000).ToList();

            // 設置并行選項
            var parallelOptions = new ParallelOptions
            {
                MaxDegreeOfParallelism = Environment.ProcessorCount // 使用處理器核心數量的線程
            };

            try
            {
                Parallel.ForEach(largeList, parallelOptions, (number) =>
                {
                    // 這里是對每個元素的處理邏輯
                    var result = ComplexCalculation(number);

                    // 注意:如果需要收集結果,要考慮線程安全
                    lock (lockObject)
                    {
                        // 進行線程安全的結果收集
                        Console.WriteLine(result);
                    }
                });
            }
            catch (AggregateException ae)
            {
                // 處理并行處理中的異常
                foreach (var ex in ae.InnerExceptions)
                {
                    Console.WriteLine($"Error: {ex.Message}");
                }
            }
        }
        private static int ComplexCalculation(int number)
        {
            // 模擬復雜計算
            Thread.Sleep(100);
            return number * 2;
        }

    }
}

圖片圖片

手動分塊處理方式

有時我們需要更精細的控制,可以手動將數據分塊并分配給不同的線程。

namespace AppParallel
{
    internal class Program
    {
        static void Main(string[] args)
        {
            var largeList = Enumerable.Range(1, 1000000).ToList();
            ProcessByChunks(largeList, 1000); // 每1000個元素一個塊
        }
        public static void ProcessByChunks<T>(List<T> largeList, int chunkSize)
        {
            // 計算需要多少個分塊
            int chunksCount = (int)Math.Ceiling((double)largeList.Count / chunkSize);
            var tasks = new List<Task>();

            for (int i = 0; i < chunksCount; i++)
            {
                // 獲取當前分塊的數據
                var chunk = largeList
                    .Skip(i * chunkSize)
                    .Take(chunkSize)
                    .ToList();

                // 創建新任務處理當前分塊
                var task = Task.Run(() => ProcessChunk(chunk));
                tasks.Add(task);
            }

            // 等待所有任務完成
            Task.WaitAll(tasks.ToArray());
        }

        private static void ProcessChunk<T>(List<T> chunk)
        {
            foreach (var item in chunk)
            {
                // 處理每個元素
                ProcessItem(item);
            }
        }

        private static void ProcessItem<T>(T item)
        {
            // 具體的處理邏輯
            Console.WriteLine($"Processing item: {item} on thread: {Task.CurrentId}");
        }

    }
}

圖片圖片

使用生產者-消費者模式

對于更復雜的場景,我們可以使用生產者-消費者模式,這樣可以更好地控制內存使用和處理流程。

public class ProducerConsumerExample
{
    private readonly BlockingCollection<int> _queue;
    private readonly int _producerCount;
    private readonly int _consumerCount;
    private readonly CancellationTokenSource _cts;

    public ProducerConsumerExample(int queueCapacity = 1000)
    {
        _queue = new BlockingCollection<int>(queueCapacity);
        _producerCount = 1;
        _consumerCount = Environment.ProcessorCount;
        _cts = new CancellationTokenSource();
    }

    public async Task ProcessDataAsync(List<int> largeList)
    {
        // 創建生產者任務
        var producerTask = Task.Run(() => Producer(largeList));

        // 創建消費者任務
        var consumerTasks = Enumerable.Range(0, _consumerCount)
            .Select(_ => Task.Run(() => Consumer()))
            .ToList();

        // 等待所有生產者完成
        await producerTask;

        // 標記隊列已完成
        _queue.CompleteAdding();

        // 等待所有消費者完成
        await Task.WhenAll(consumerTasks);
    }

    private void Producer(List<int> items)
    {
        try
        {
            foreach (var item in items)
            {
                if (_cts.Token.IsCancellationRequested)
                    break;

                _queue.Add(item);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Producer error: {ex.Message}");
            _cts.Cancel();
        }
    }

    private void Consumer()
    {
        try
        {
            foreach (var item in _queue.GetConsumingEnumerable())
            {
                if (_cts.Token.IsCancellationRequested)
                    break;

                // 處理數據
                ProcessItem(item);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Consumer error: {ex.Message}");
            _cts.Cancel();
        }
    }

    private void ProcessItem(int item)
    {
        // 具體的處理邏輯
        Thread.Sleep(100); // 模擬耗時操作
        Console.WriteLine($"Processed item {item} on thread {Task.CurrentId}");
    }
}

// 使用示例
static async Task Main(string[] args)
{
    var processor = new ProducerConsumerExample();
    var largeList = Enumerable.Range(1, 10000).ToList();
    await processor.ProcessDataAsync(largeList);
}

圖片圖片

注意事項

  1. 合適的分塊大小

a.分塊不要太小,否則線程切換開銷會抵消并行處理的優勢

b.也不要太大,否則會影響負載均衡

c.建議從1000-5000個元素每塊開始測試

  1. 異常處理

a.務必妥善處理并行處理中的異常

b.使用try-catch包裝每個任務

c.考慮使用CancellationToken來優雅終止所有任務

  1. 資源管理

a.注意內存使用,避免同時加載過多數據

b.合理控制線程數量,通常不超過處理器核心數的2倍

c.使用using語句管理IDisposable資源

  1. 線程安全

a.訪問共享資源時確保使用適當的同步機制

b.考慮使用線程安全的集合類

c.避免過度鎖定導致性能下降

總結

并行處理大數據列表是提高程序性能的有效方式,但需要根據具體場景選擇合適的實現方式。本文介紹的三種方法各有特點:

  • Parallel.ForEach: 適合簡單場景,實現簡單
  • 手動分塊處理:提供更多控制,適合中等復雜度場景
  • 生產者-消費者模式:適合復雜場景,可以更好地控制資源使用

在實際應用中,建議先進行性能測試,根據數據量大小和處理復雜度選擇合適的實現方式。同時要注意異常處理和資源管理,確保程序的穩定性和可靠性。

責任編輯:武曉燕 來源: 技術老小子
相關推薦

2010-04-07 14:22:46

2009-09-02 18:52:38

Oracle數據庫并行

2020-12-31 11:49:13

大數據大數據應用

2024-02-23 09:36:57

C#工具并行處理

2016-02-16 14:30:00

HadoopDoug Cuttin大數據

2024-04-03 00:10:24

C#System數據

2024-04-03 00:06:03

2010-04-09 14:48:41

Oracle數據庫

2010-04-09 14:37:08

Oracle數據庫

2024-05-06 00:00:00

C#序列化技術

2024-09-18 00:00:02

反射C#元數據

2024-07-03 08:15:39

C#字符串表達式

2009-09-02 18:34:28

C#鼠標事件

2025-04-30 01:50:00

C#異步編程

2015-12-18 15:06:58

2012-09-17 13:44:16

架構數據

2021-03-26 09:49:22

架構并行處理

2009-08-31 16:47:39

C#接口的定義

2009-01-19 10:26:02

C#Namespace.NET

2013-04-27 16:44:54

大數據大數據全球技術峰會
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 成人亚洲 | 秋霞电影一区二区三区 | 9999国产精品欧美久久久久久 | 99精品一区二区三区 | 国产91丝袜在线熟 | 91精品国产综合久久婷婷香蕉 | 中文久久| 成人妇女免费播放久久久 | 欧美日韩国产综合在线 | 久久精品欧美一区二区三区不卡 | 中文字幕色站 | 日韩一区二区三区视频 | 亚洲精品国产一区 | 日韩视频精品在线 | 91免费观看 | 国产日韩久久 | www.伊人.com | 欧美日本免费 | 欧美黑人一级爽快片淫片高清 | 日本精品一区二区三区视频 | 国产精品久久久久久一级毛片 | 免费一级毛片 | 欧美精品导航 | 午夜资源| 一区二区av在线 | 国产一区二区成人 | 色综合久久天天综合网 | 日日日干干干 | www.婷婷| 亚洲国产精品99久久久久久久久 | h视频在线观看免费 | 青青草社区 | 欧美视频一区 | 亚洲天堂中文字幕 | 国产精品99久久久久久动医院 | 国内自拍视频在线观看 | 嫩草视频网 | 99免费视频| 成人免费一区二区三区视频网站 | 天天干狠狠操 | 欧美激情精品久久久久 |