Intel開源基于Spark的深度學習庫BigDL
作者:佚名
近日,Intel 開源了 BigDL,這是一個基于 Apache Spark 的分布式深度學習庫。使用 BigDL ,用戶可以將他們的深度學習應用程序作為標準的 Spark 程序,它可以直接運行在現有的 Spark 或 Hadoop 集群之上。
近日,Intel 開源了 BigDL,這是一個基于 Apache Spark 的分布式深度學習庫。使用 BigDL ,用戶可以將他們的深度學習應用程序作為標準的 Spark 程序,它可以直接運行在現有的 Spark 或 Hadoop 集群之上。
特性:
- 豐富的深度學習支持。BigDL 模仿 Torch,提供對深度學習的全方位支持,包括數值計算(通過Tensor)和高層次神經網絡。此外,用戶可以使用 BigDL 將預訓練的 Caffe 或 Torch 模型加載到 Spark 程序中。
- 極其高的性能。為了達到高性能,BigDL 在每個 Spark 任務中使用 Intel MKL和多線程編程。因此,它比單節點 Xeon 上的開箱即用的 Caffe、Torch 或 TensorFlow 快幾個數量級。
- 有效地橫向擴展。 BigDL 可以通過利用 Apache Spark 以及高效實施同步 SGD, 全面減少 Spark 上的通信,有效地向外擴展,以“大數據規模”執行數據分析。
使用場景:
- 你想要在在大數據云(Hadoop/Spark)分析(存儲在如 HDFS、HBase、Hive上的)海量數據。
- 你想向你的大數據(Spark)程序和/或工作流添加深度學習功能(訓練或者預測)。
- 你想利用已有的 Hadoop/Spark 集群來運行深度學習程序,然后可以與其他工作負載動態共享(例如,ETL、數據倉庫、功能引擎、經典機器學習、圖像分析等)。
責任編輯:未麗燕
來源:
開源中國社區