成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

英特爾開源分布式深度學習庫BigDL:支持高性能大數據分析

大數據 數據分析 分布式
近日,英特爾開源了一個運行在 Apache Spark 上的分布式深度學習庫 BigDL,其可以利用已有的 Spark 集群來運行深度學習計算,并且還能簡化從 Hadoop 的大數據集的數據加載。

近日,英特爾開源了一個運行在 Apache Spark 上的分布式深度學習庫 BigDL,其可以利用已有的 Spark 集群來運行深度學習計算,并且還能簡化從 Hadoop 的大數據集的數據加載。

開源地址>>>

據介紹,在 Xeon 服務器上的測試表明,BigDL 相比于 Caffe、Torch 或 TensorFlow 等開源框架實現了顯著的速度提升。其速度可與主流的 GPU 相媲美,而且 BigDL 也能擴展到多達數十個 Xeon 服務器。

英特爾開源分布式深度學習庫BigDL:支持高性能大數據分析

BigDL 庫支持 Spark 1.5、1.6 和 2.0,并且允許將深度學習嵌入到已有的基于 Spark 的程序中。其中包含了將 Spark RDD(Resilient Distributed Datasets,彈性分布式數據集)轉換成 BigDL 定義的 Dataset 的方法,并且也可以直接運用到 Spark ML Pipelines 上。

為了進行模型訓練,BigDL 應用了一個同步小批量隨機梯度下降(synchronous mini-batch SGD),該過程在跨多個執行器(executor)的單個 Spark 任務中執行。每一個執行器都執行一個多線程引擎并處理一部分微批量數據(micro-batch data)。在當前的版本中,所有的訓練和驗證數據都會加載到內存(memory)中。

BigDL 是用 Scala 實現的,并且模仿了 Torch。類似于 Torch,它也提供了一個 Tensor 類,其使用了 Intel MKL 庫進行計算。Intel MKL 是英特爾的數學核心函數庫(Math Kernel Library)的縮寫,其中包含了一系列為計算優化過的歷程,其中包括 FFT(快速傅立葉變換)和矩陣乘法等等,這些計算在深度學習模型訓練中有廣泛的應用。另外受到 Torch 的 nn 包(https://github.com/torch/nn)的啟發,BigDL 借鑒了 Torch,提出了 Module 的概念,用于表示單個神經網絡層、Table 和 Criterion。

BigDL 還提供了一個 AWS EC2 鏡像和一些案例,其中包括:文本分類(使用卷積神經網絡)、圖像分類、以及將 Torch 或 Caffe 中預訓練的模型加載到 Spark 中用于預測計算的方法。目前社區討論區上大多數用戶請求 BigDL 支持 Python,以及開發 MKL-DNN(MKL 的深度學習擴展)。

以下是 BigDL GitHub 項目的 README.md 介紹:

BigDL:在 Apache Spark 上的分布式深度學習

BigDL 是什么?

BigDL 是一個用于 Apache Spark 的分布式深度學習庫。使用 BigDL,用戶可以像編寫標準 Spark 程序一樣編寫深度學習應用,并且可以直接將其運行在已有的 Spark 或 Hadoop 集群上。BigDL 有哪些優點呢?

豐富的深度學習支持。類似 Torch,BigDL 提供了全面的深度學習支持,包括數值計算(通過 Tensor)和高層面的神經網絡;此外,用戶還可以使用 BigDL 將預訓練的 Caffe 或 Torch 模型加載到 Spark 程序中。

極高的性能。為了實現高性能,BigDL 在每一個 Spark 任務中都使用了 Intel MKL 和多線程編程。從而使得 BigDL 在單節點 Xeon(與主流 GPU 媲美)上能夠實現比當前開源的 Caffe、Torch 或 TensorFlow 快幾個數量級的表現。

有效的擴展。BigDL 可以利用 Apache Spark(一種超快的分布式數據處理框架)以及同步 SGD 的有效實現和在 Spark 上的 all-reduce 通信來進行有效地擴展,從而可在「大數據規模」上執行數據分析。

為什么選擇 BigDL?

如果你滿足以下條件,你就應該使用 BigDL 來編寫你的深度學習程序:

  • 你想在數據存儲(比如以 HDFS、HBase、Hive 等方式)于的同一個大數據(Hadoop/Spark)集群上進行大量數據的分析。
  • 你想為你的大數據(Spark)程序和/或工作流添加深度學習功能(不管是訓練還是預測)。
  • 你想使用已有的 Hadoop/Spark 集群來運行你的深度學習應用,然后將其動態地共享給其它工作負載(如 ETL、數據倉庫、特征工程、經典機器學習、圖分析等等)。
責任編輯:未麗燕 來源: 36大數據
相關推薦

2013-04-27 11:43:19

大數據全球技術峰會

2017-01-20 13:58:31

英特爾GPUCPU

2021-09-23 16:10:06

數據庫工具技術

2013-02-18 15:15:32

英特爾大數據Apache

2013-03-15 17:37:33

Hadoop英特爾CPU

2017-07-21 13:02:30

英特爾Cloudera

2013-11-20 11:30:12

英特爾超算技術大數據分析

2013-03-07 10:16:04

紅帽

2017-02-15 14:36:12

開源大數據TensorFlowO

2010-06-03 18:28:54

英特爾高性能計算

2013-05-07 11:40:52

英特爾低功耗高性能

2015-09-24 14:52:29

英特爾數據分析精準醫療

2013-11-22 15:18:27

2013-02-28 10:04:27

英特爾Hadoop大數據

2013-08-19 09:04:25

英特爾大數據

2023-12-18 11:21:40

MongoDB數據庫

2020-09-28 14:49:48

多架構英特爾性能

2017-01-11 16:36:51

Intel開源BigDL

2022-06-30 08:04:16

Redis分布式鎖Redisson

2013-05-20 10:06:52

英特爾大數據行業
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 婷婷精品| 成人午夜精品 | 午夜码电影 | 欧美日韩成人 | 中文字幕在线一区二区三区 | 日韩精品四区 | 成人免费一区二区三区牛牛 | 午夜精品视频 | 成人福利在线 | 91av在线视频观看 | 成人av网站在线观看 | h片在线观看网站 | 欧美日韩成人在线 | 最新国产精品视频 | www.色综合| 久久久久亚洲精品 | 日韩一二区在线 | 国产精品污www一区二区三区 | 久久av一区二区三区 | 国产精品亚洲一区 | 欧美综合一区二区三区 | 欧美精品二区三区 | 成人免费视频 | 狠狠色综合欧美激情 | 九九国产| 波多野结衣在线观看一区二区三区 | www.4hu影院 | 精品久久影院 | 在线日韩中文字幕 | 91精品国产综合久久福利软件 | 鲁一鲁资源影视 | 九九热在线免费视频 | 久久精品国产久精国产 | 久久久久久国产精品久久 | 国产你懂的在线观看 | 国产一区二区不卡 | 一级少妇女片 | 三级免费av| 欧美激情一区二区 | 中文字幕亚洲视频 | 毛片在线看看 |