成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

全球首個軟硬件推理平臺:NVDLA 編譯器正式開源

新聞 開源
最近,英偉達在 GitHub 上開源了 NVDLA 編譯器的源代碼,這是世界上首個軟硬件推理平臺的完整開源代碼。

2017 年,英偉達發布了深度學習加速器 NVDLA,全稱 NVIDIA DeepLearning Accelerator,以推動在定制硬件設計中采用高效的 AI 推理。

在英偉達的開發套件 Jetson AGX Xavier 中,它能為 AI 模型提供 7.9 TOPS/W 的最佳峰值效率。

而最近,英偉達在 GitHub 上開源了 NVDLA 編譯器的源代碼,這是世界上首個軟硬件推理平臺的完整開源代碼。系統架構師和軟件開發者們,現在已可訪問這個軟硬件推理平臺。

全球首個軟硬件推理平臺:NVDLA 編譯器正式開源

使用 NVDLA 進行物體檢測

在本文中,將詳細介紹網絡圖形編譯器,是如何提升了專用硬件加速器的性能,并介紹在云端,如何構建和運行自定義 NVDLA 軟硬件設計。

NVDLA 編譯器的性能和效率

編譯器是 NVDLA 軟件棧的關鍵組件。它能生成優化的執行圖,將預訓練的神經網絡模型層中定義的任務,映射到 NVDLA 中的各個執行單元。

一方面能最大限度地利用計算硬件,另一方面盡可能地減少數據移動。

NVDLA 核心硬件有六個專門的硬件單元,可以實現同時調度,或者在流水線配置中實現調度。

全球首個軟硬件推理平臺:NVDLA 編譯器正式開源

NVDLA 架構圖

此外,它還具有小型和大型硬件配置文件。其中大型配置文件含有一些高級特性,如芯片上的 SRAM 接口、連接微控制器的能力。

全球首個軟硬件推理平臺:NVDLA 編譯器正式開源

NVDLA 小型配置文件模型

硬件架構是模塊化的,它被設計成可自由伸縮的形態,小到嵌入式物聯網設計,大到使用NVDLA 單元陣列的大型數據中心,都能完美適用。

編譯器可以根據多項因素進行調優:NVDLA 硬件配置、系統的 CPU 和內存控制配置,以及應用程序的自定義神經網絡用例等等。

NVDLA 是如何提升性能的

在大型的 NVDLA 設計上,層融合和管道調度之類的編譯器優化,表現性能良好,可廣泛應用于多種神經網絡架構,能提供高達 3 倍的性能效益。

這種優化后的靈活性,是實現跨大型網絡模型(如ResNet-50)和小型網絡模型(如 MobileNet)的性能優化的重要原因。

對于較小的 NVDLA 設計,編譯器優化(如 Memory tiling )也是提高性能效率的關鍵。

Memory tiling 設計能在權重和激活數據之間,平衡芯片上緩沖區的使用,從而最小化芯片外存儲的流量和能耗。

用戶還可以自由地創建定制的圖層,并根據自己的特殊用例進行調優,或者使用最新的算法進行實驗。

為了方便對比,可以根據下面的性能數字,評估 NVDLA 大型模型的預期性能。測量數據來自 Jetson AGX Xavier 開發工具上的一個 NVDLA 核心捕獲。

全球首個軟硬件推理平臺:NVDLA 編譯器正式開源

使用 RISC-V 和 FireSim 在云端設計

通過這個編譯器版本,NVDLA 用戶可以訪問集成、增添和探索 NVDLA 平臺所需的軟件和硬件源代碼。

如果想要嘗試入手,建議的方式是直接使用 NVDLA 上的 YOLOv3 ,以及云端的 RISC-V 和 FireSim 進行物體檢測。

在使用 FireSim- NVADLA 時,可按照 FireSim 的說明操作,直到能夠運行單節點模擬為止。

使用指南:http://docs.fires.im/en/1.5.0/index.html

按照教程中的步驟操作,在「設置FireSim Repo」一節中,驗證是否正使用 FireSim -NVADLA 存儲庫,具體的操作代碼如下:

  1. git clone https://github.com/CSL-KU/firesim-nvdla 
  2. cd firesim-nvdla 
  3. ./build-setup.sh fast 

使用 NVDLA 運行單節點模擬之后,按照 NVDLA 教程中的步驟可以立即啟動 YOLOv3。(地址:https://github.com/CSL-KU/firesim-nvdla#running-yolov3-on-nvdla)

這套編譯器已經被 SiFive 這類初創公司所使用,并從中得到了受益。

全球首個軟硬件推理平臺:NVDLA 編譯器正式開源

SiFive 使用 NVDLA 進行深度學習推理

據悉,SiFive 在一年前首次在自己的平臺上開始使用 NVDLA,而經過了性能優化的開源 NVDLA 編譯器,能夠創建特定領域的優化 SoC 設計,為 IoT Edge 中的 AI 現代計算需求做足準備。

項目開源地址:

https://github.com/nvdla/sw/releases/tag/v1.2.0-OC

 

責任編輯:張燕妮 來源: 今日頭條
相關推薦

2023-11-04 21:36:21

人形機器人

2017-08-14 13:40:34

VDI軟硬件IT

2021-01-28 14:20:56

區塊鏈邊緣計算自主可控

2022-01-28 08:22:36

深度學習編譯器開源

2015-11-12 10:42:12

2010-01-11 10:25:08

Linux軟硬件配置

2013-08-27 18:28:01

NECBIRTV

2010-04-23 10:30:16

實現負載均衡

2019-08-06 08:20:07

編譯器工具開發者

2015-08-19 10:25:35

格力董明珠手機

2012-06-19 10:34:36

微軟surface平板

2011-03-09 09:33:51

Stack Overf架構

2019-09-10 08:30:55

華為開發者開源

2021-01-14 08:00:00

服務器數據中心DokuWiki

2009-07-07 09:14:53

Milepost GC編譯器

2022-08-29 10:47:43

微信支付寶信用卡

2015-07-29 12:42:11

ODL軟硬件平臺SDN大賽華為

2019-06-26 09:32:28

華為禁令開發

2010-05-12 15:11:18

華夏擎工作組LOGO有獎征集
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美bondage紧缚视频 | 精品国产青草久久久久福利 | 91视频麻豆 | 日本不卡在线视频 | 午夜精品久久久久久久久久久久 | 成人久久一区 | 99这里只有精品视频 | av免费网站在线观看 | 天天天操天天天干 | 99影视 | 天天干天天色 | 午夜成人免费视频 | 色一情一乱一伦一区二区三区 | 91精品国产综合久久久久蜜臀 | 国产精品久久 | 国产999精品久久久久久 | 中文字幕av在线播放 | 国产成人免费视频网站视频社区 | 日本一卡精品视频免费 | 日本一区二区视频 | 99在线免费观看 | av黄色免费 | 国产成人精品免费 | 精品一区二区久久久久久久网站 | 亚洲综合在线视频 | 欧美一级片在线看 | 伊人网在线综合 | 伊人久久在线 | 色婷婷综合网 | 国产三区视频在线观看 | 亚洲国产成人精品女人久久久 | 久久一视频 | 亚洲一区精品在线 | 视频二区在线观看 | 91精品亚洲 | 日韩一区二区三区在线播放 | 九九热在线精品视频 | 午夜精品久久久久久久久久久久 | 欧美日韩一区二区电影 | 免费污视频 | 中文字幕一区二区三区在线视频 |