成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

斯坦福DAWNBench:華為云ModelArts深度學習訓練全球最快

企業(yè)動態(tài)
近日,斯坦福大學發(fā)布了DAWNBenchmark最新成績,在圖像識別(ResNet50-on-ImageNet,93%以上精度)的總訓練時間上,華為云ModelArts排名第一,僅需10分28秒,比第二名提升近44%。成績證明,華為云ModelArts實現了更低成本、更快速度、更極致的體驗。

近日,斯坦福大學發(fā)布了DAWNBenchmark***成績,在圖像識別(ResNet50-on-ImageNet,93%以上精度)的總訓練時間上,華為云ModelArts***,僅需10分28秒,比第二名提升近44%。成績證明,華為云ModelArts實現了更低成本、更快速度、更***的體驗。

斯坦福大學DAWNBench是用來衡量端到端的深度學習模型訓練和推理性能的國際權威基準測試平臺,相應的排行榜反映了當前全球業(yè)界深度學習平臺技術的領先性。計算時間和成本是構建深度模型的關鍵資源,DAWNBench提供了一套通用的深度學習評價指標,用于評估不同優(yōu)化策略、模型架構、軟件框架、云和硬件上的訓練時間、訓練成本、推理延遲以及推理成本。

[[251300]]

斯坦福大學DAWNBenchmark***成績

斯坦福大學DAWNBenchmark網頁鏈接:https://dawn.cs.stanford.edu/benchmark/

作為人工智能最重要的基礎技術之一,近年來深度學習也逐步延伸到更多的應用場景。隨著深度學習模型越來越大,所需數據量越來越多,深度學習的訓練和推理性能將是重中之重。華為云ModelArts將結合華為在AI芯片、硬件、云設施、軟件和算法的全棧優(yōu)勢,打造更快的普惠的AI開發(fā)平臺。

下文將深入分析,華為云ModelArts如何做到性能***——128塊GPU,ImageNet訓練時間10分鐘。

1. 深度學習已廣泛應用,模型增大、數據增長,深度學習訓練加速的需求日益劇增

近年來,深度學習已經廣泛應用于計算機視覺、語音識別、自然語言處理、視頻分析等領域,可服務于視頻監(jiān)控、自動駕駛、搜索推薦、對話機器人等場景,具有廣闊的商業(yè)價值。

為了達到更高的精度,通常深度學習所需數據量和模型都很大,訓練非常耗時。例如,在計算機視覺中,如果我們在ImageNet[1]數據集上用1塊P100 GPU訓練一個ResNet-50模型, 則需要耗時將近1周。這嚴重阻礙了深度學習應用的開發(fā)進度。因此,深度學習訓練加速一直是學術界和工業(yè)界所關注的重要問題,也是深度學習應主要用的痛點。

Jeremy Howard等幾位教授領銜的fast.ai當前專注于深度學習加速,在ImageNet數據集上用128塊V100 GPU訓練 ResNet-50模型的最短時間為18分鐘。

然而,最近BigGAN、NASNet、BERT等模型的出現,預示著訓練更好精度的模型需要更強大的計算資源。可以預見,在未來隨著模型的增大、數據量的增加,深度學習訓練加速將變得會更加重要。只有擁有端到端全棧的優(yōu)化能力,才能使得深度學習的訓練性能做到***。

[1] 文中所指的ImageNet數據集包含1000類個類別,共128萬張圖片,是最常用、最經典的圖像分類數據集,是原始的ImageNet數據的一個子集。

2. 華為云ModelArts創(chuàng)造新紀錄,“***”的訓練速度

華為云ModelArts是一站式的AI開發(fā)平臺,已經服務于華為公司內部各大產品線的AI模型開發(fā),幾年下來已經積累了跨場景、軟硬協(xié)同、端云一體等多方位的優(yōu)化經驗。ModelArts提供了自動學習、數據管理、開發(fā)管理、訓練管理、模型管理、推理服務管理、市場等多個模塊化的服務,使得不同層級的用戶都能夠很快地開發(fā)出自己的AI模型。

 

圖1. 華為云ModelArts功能視圖

在模型訓練部分,ModelArts通過硬件、軟件和算法協(xié)同優(yōu)化來實現訓練加速。尤其在深度學習模型訓練方面,華為將分布式加速層抽象出來,形成一套通用框架——MoXing(“模型”的拼音,意味著一切優(yōu)化都圍繞模型展開)。采用與fast.ai一樣的硬件、模型和訓練數據,ModelArts可將訓練時長可縮短到10分鐘,創(chuàng)造了新的紀錄,為用戶節(jié)省44%的時間。

圖2. 基于MoXing和ModelArts的訓練速度提升

3.分布式加速框架MoXing

MoXing是華為云ModelArts團隊自研的分布式訓練加速框架,它構建于開源的深度學習引擎TensorFlow、MXNet、PyTorch、Keras之上,使得這些計算引擎分布式性能更高,同時易用性更好。

高性能

MoXing內置了多種模型參數切分和聚合策略、分布式SGD優(yōu)化算法、級聯(lián)式混合并行技術、超參數自動調優(yōu)算法,并且在分布式訓練數據切分策略、數據讀取和預處理、分布式通信等多個方面做了優(yōu)化,結合華為云Atlas高性能服務器,實現了硬件、軟件和算法協(xié)同優(yōu)化的分布式深度學習加速。

D:\HC2018\軟文\images\images\f3-moxing-arch-CN.JPG

圖3. 華為云MoXing架構圖

易用:讓開發(fā)者聚焦業(yè)務模型,無憂其他

在易用性方面,上層開發(fā)者僅需關注業(yè)務模型,無需關注下層分布式相關的API,僅需根據實際業(yè)務定義輸入數據、模型以及相應的優(yōu)化器即可,訓練腳本與運行環(huán)境(單機或者分布式)無關,上層業(yè)務代碼和分布式訓練引擎可以做到完全解耦。

4.從兩大指標看MoXing分布式加速關鍵技術

在衡量分布式深度學習的加速性能時,主要有如下2個重要指標:

1)吞吐量,即單位時間內處理的數據量;

2)收斂時間,即達到一定的收斂精度所需的時間。

吞吐量一般取決于服務器硬件(如更多、更大FLOPS處理能力的AI加速芯片,更大的通信帶寬等)、數據讀取和緩存、數據預處理、模型計算(如卷積算法選擇等)、通信拓撲等方面的優(yōu)化,除了低bit計算和梯度(或參數)壓縮等,大部分技術在提升吞吐量的同時,不會造成對模型精度的影響。為了達到最短的收斂時間,需要在優(yōu)化吞吐量的同時,在調參方面也做調優(yōu)。如果調參調的不好,那么吞吐量有時也很難優(yōu)化上去,例如batch size這個超參不足夠大時,模型訓練的并行度就會較差,吞吐量難以通過增加計算節(jié)點個數而提升。

對用戶而言,最終關心的指標是收斂時間,因此MoXing和ModelArts實現了全棧優(yōu)化,極大縮短了訓練收斂時間。在數據讀取和預處理方面,MoXing通過利用多級并發(fā)輸入流水線使得數據IO不會成為瓶頸;在模型計算方面,MoXing對上層模型提供半精度和單精度組成的混合精度計算,通過自適應的尺度縮放減小由于精度計算帶來的損失;在超參調優(yōu)方面,采用動態(tài)超參策略(如momentum、batch size等)使得模型收斂所需epoch個數降到***;在底層優(yōu)化方面,MoXing與底層華為自研服務器和通信計算庫相結合,使得分布式加速進一步提升。

5.測試結果對比,用數據說話

一般在ImageNet數據集上訓練ResNet-50模型,當Top-5精度≥93%或者Top-1 精度≥75%時即可認為模型收斂。

我們測試的模型訓練收斂曲線如下圖所示。此處Top-1和Top-5精度為訓練集上的精度,為了達到***的訓練速度,訓練過程中采用了額外進程對模型進行驗證,最終驗證精度如表1所示(包含與fast.ai的對比)。圖4(a)所對應的模型在驗證集上Top-1 精度≥75%,訓練耗時為10分06秒;圖4(b)所對應的模型在驗證集上Top-5 精度≥93%,訓練耗時為10分28秒。

圖4. 華為云團隊用128塊V100完成ResNet50 on ImageNet訓練收斂曲線(曲線上的精度為訓練集上的精度)

表1. MoXing與fast.ai的訓練結果對比

6. 未來展望——更快的普惠AI開發(fā)平臺

華為云ModelArts致力于為用戶提供更快的普惠AI開發(fā)體驗,尤其在模型訓練這方面,內置的MoXing框架使得深度學習模型訓練速度有了很大的提升。正如前所述,深度學習加速屬于一個從底層硬件到上層計算引擎、再到更上層的分布式訓練框架及其優(yōu)化算法多方面協(xié)同優(yōu)化的結果,具備全棧優(yōu)化能力才能將用戶訓練成本降到***。

后續(xù),華為云ModelArts將進一步整合軟硬一體化的優(yōu)勢,提供從芯片(Ascend)、服務器(Atlas Server)、計算通信庫(CANN)到深度學習引擎(MindSpore)和分布式優(yōu)化框架(MoXing)全棧優(yōu)化的深度學習訓練平臺。并且,ModelArts會逐步集成更多的數據標注工具,擴大應用范圍,將繼續(xù)服務于智慧城市、智能制造、自動駕駛及其它新興業(yè)務場景,在公有云上為用戶提供更普惠的AI服務。

目前華為云ModelArts已經在公測中,歡迎大家試用。

ModelArts官網:https://www.huaweicloud.com/product/modelarts.html

 

 

 

責任編輯:Jane 來源: 華為
相關推薦

2018-12-17 11:06:34

華為云

2019-03-24 12:11:47

AI 數據人工智能

2025-04-25 13:34:53

R1DeepSeekAgent

2012-03-21 21:38:27

蘋果

2009-05-19 09:06:41

Apple斯坦福iPhone

2013-01-31 09:45:14

斯坦福超級電腦百萬內核

2019-12-16 14:33:01

AI人工智能斯坦福

2018-11-21 14:54:56

2024-09-26 10:23:46

2025-01-17 10:26:19

模型開發(fā)ChatGPT

2023-11-13 07:51:58

ChatGPT研究

2023-12-08 13:22:00

數據模型

2017-11-28 14:18:29

2016-09-27 16:06:48

2023-12-07 10:11:20

模型AI

2023-03-06 10:26:37

AI研究

2025-03-12 10:38:05

2018-04-05 22:55:34

數據問答系統(tǒng)SQuAD

2021-04-22 12:43:00

華為云IaaS

2020-12-02 10:09:00

機器學習人工智能計算機
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 中文字幕日韩欧美一区二区三区 | 91精品国产一区二区在线观看 | 黄视频在线网站 | 国产精品美女久久久久久久网站 | aaaaaa大片免费看最大的 | 精久久 | 男女视频免费 | 91精品国产91久久久久久吃药 | 日本视频免费观看 | 国产98色在线 | 日韩 | 九九激情视频 | 天堂成人国产精品一区 | 色综合久久久 | 亚洲网站观看 | 日韩欧美三区 | 中文字幕亚洲一区二区三区 | 国产免费一区二区三区 | 中文字幕第九页 | 日韩欧美国产精品一区二区三区 | 久久久久久久久毛片 | 欧美日韩亚洲二区 | 久久久人成影片一区二区三区 | 色偷偷888欧美精品久久久 | 国产一区二区三区四区三区四 | 国产午夜在线 | 成人精品免费视频 | 成年无码av片在线 | av在线成人| 午夜电影福利 | 日本一区二区三区精品视频 | 日韩精品一区二区三区 | 亚洲成人一区二区在线 | 蜜桃精品在线 | 亚洲欧美激情国产综合久久久 | 久久综合九色综合欧美狠狠 | 99re66在线观看精品热 | 爱爱视频日本 | 欧美一区二区三区在线免费观看 | 久久精品中文字幕 | 亚洲精品久久久久久宅男 | 精品国产黄色片 |