NVIDIA發布包含數十種新的、更新的加速計算庫
NVIDIA發布了65個全新及更新的軟件開發工具包,包括庫、代碼樣本和指南,為正在推動廣泛計算挑戰前沿的數據科學家、研究者、學生和開發者帶來更好的特性和功能,這些新推出及更新的加速計算庫再次體現了NVIDIA在軟件方面的投入,及其對AI行業的承諾。
NVIDIA創始人兼首席執行官黃仁勛在其GTC主題演講中發布了這些新增內容,其中包括用于加速量子計算、到戶交付算法和圖形神經網絡挖掘的新一代SDK。
NVIDIA產品目錄中有150多個加速計算工具包,NVIDIA開發者計劃中的近300萬名成員使用這些工具包,這個數字在過去五年增長了6倍。CUDA(并行計算平臺和編程模型)僅在去年就被下載了700萬次,自發布以來的下載次數已達到3000萬次。
拓展新市場
新發布的SDK有:
NVIDIA ReOpt:用于實時物流,引入了先進的大規模并行算法,可以優化車輛路線、倉庫選擇和車隊組合。其動態改道功能可以減少旅行時間、節省燃料成本并最大限度地減少閑置時間,這將為物流和供應鏈行業節省數十億美元。
cuNumeric:用于陣列計算,實現NumPy應用編程接口,可以自動擴展到多GPU和多節點系統,而不需要修改代碼。這將給使用Python的2000萬名數據科學家、研究者和科學家帶來重要的價值。該工具包現已在GitHub和Conda上提供,可以擴展到數千個GPU,為PyData和NumPy生態系統創造加速計算。
cuQuantum:用于量子計算,大大加快了模擬大型量子電路的速度,使量子研究者能夠研究更廣泛的算法和應用空間。開發者可以模擬分子的近期變異量子算法和能夠識別容錯的糾錯算法等領域,也可以加速Atos、谷歌和IBM的流行量子模擬器
CUDA-X加速 DGL容器:用于圖形神經網絡,為從事具有大型圖形的GNN的開發者和數據科學家提供了一種快速建立工作環境的方法。該容器使得在結合DGL和Pytorch的集成GPU加速GNN 環境中的工作變得很容易。憑借GPU加速GNN,我們可以挖掘圖形中的洞察,即使是有接近一萬億條邊的全球最大圖形也不例外。例如Pinterest使用具有數十億個節點和邊緣的圖形神經網絡來了解其具有超過3000億個Pin的生態系統。該網絡基于GPU和各種經過優化的庫,可用于模型的訓練和推理。
Amazon Web Services機器學習總監Alex Smola表示:“我們團隊十分高興能與NVIDIA合作,通過用于圖形構建的RAPIDS cuDF、用于圖形采樣的RAPIDS cuGraph和GNN的自定義計算內核來加速DGL。而開源的DGL也能通過亞馬遜NeptuneML以托管式服務的形式提供。”
經過更新的SDK加速應用開發
眾多最受歡迎的NVIDIA SDK都增強了功能并進行了升級,包括Clara、DLSS、RTX、Nsight和Isaac工具包。
其他經過更新的SDK包括:
RAPIDS 21.10:用于數據科學,提供時間序列數據處理這項新功能并對現有算法進行多項加速。適用于 Apache Spark 3.0 的 RAPIDS 加速器允許企業在不更改代碼的情況下加速其在 NVIDIA GPU 上的分析操作。今年以來,NVIDIA最受歡迎的SDK之一——RAPIDS的下載量增長了400%。
Deepstream 6.0:用于智能視頻分析的Deepstream 6.0引入了新的圖形合成器界面,使具有最低編碼能力的用戶也能使用計算機視覺,還引入了可視化拖放界面,可實現簡單、直觀的AI產品開發流程。
Triton 2.15、TensorRT 8.2和cuDNN 8.4:用于深度神經網絡,為大型語言模型提供新的優化,并且為梯度增強決策樹和隨機森林提供推理加速。
DOCA 1.2:用于數據中心網絡,提供一個零信任的安全框架,該框架通過硬件和軟件認證、線路速率數據加密、分布式防火墻和智能遙測來擴展威脅保護。
Merlin 0.8:用于推薦系統,具有預測用戶下一步行動的新功能,只需很少的用戶數據,甚至無需用戶數據,并且支持大于GPU內存的模型。
適用于SDK的新培訓課程
根據IDC預計,全球全職開發者的短缺數量預計將從2021年的140萬增加到2025年的400萬。該分析公司認為,創建提供教育和賦能的基礎設施是彌補這一短缺的長期解決方案。
NVIDIA深度學習培訓中心的兩門新課程支持并加速開發者對SDK的學習和使用,為該學院的40多門課程目錄增添新的內容。
“用于DPU的DOCA介紹”是一門自學課程。該課程向開發者、研究者和學生介紹NVIDIA DOCA的基本概念。NVIDIA DOCA是一個用于在NVIDIA BlueField DPUs上實現加速數據中心計算的平臺。
將于本月晚些時候推出的“構建實時視頻AI應用”課程將介紹如何使用NVIDIA DeepStream智能視頻分析工具和NVIDIA TAO工具套件將原始視頻數據轉化為基于實時深度學習的洞察,從而實現用于構建高性能流媒體管道的硬件加速組件。
配合新SDK的NVIDIA 深度學習培訓中心課程包括:
由教師授課的“加速數據科學基礎”和自學課程“加速端到端數據科學工作流”使用NVIDIA RAPIDS加速數據科學庫來應用各種GPU加速機器學習算法,包括XGBoost、cuGRAPH的單源最短路徑以及cuML的 KNN、DBSCAN和邏輯回歸,以便執行大規模的數據分析。
“構建智能推薦系統”涵蓋NVIDIA Merlin和其他用于構建高效推薦系統的基本工具和技術以及如何部署用于實時推薦的GPU加速解決方案。