讓AI軟件編寫成為過去式,盤點GTC2024上發布的軟件開發工具
原創在推動生成式AI落地應用的進程中,除了高性能的算力之外,面向不同行業的不同場景,如何快速開發構建應用也成為擺在很多企業面前的主要挑戰。在GTC 2024上,NVIDIA發布了一系列面向生成式AI應用開發的軟件包,讓人眼前一亮。
那么,NVIDIA都發布了哪些軟件開發工具?它們都有哪些看點。接下來,讓我們來盤點一下。
創造性的發布生成式AI軟件開發方式
GTC 2024上,黃仁勛認為,生成式 AI 改變了應用程序的編寫方式。未來的公司不應該把精力放在編寫軟件上,而是要放在組裝 AI 模型,賦予它們任務,給出工作產品示例,并審查計劃和中間結果。
為此,NVIDIA推出了專為加速計算庫和生成式AI模型建的全新軟件包,供開發者在已安裝 NVIDIA CUDA GPU 的系統中創建和部署生成式 AI 助手。與此同時,NVIDIA發布Omniverse Cloud API,為眾多工業數字孿生軟件工具提供助力。
NVIDIA用生成式AI微服務的方式,創造式的改變了生成式AI軟件的開發方式。對于企業而言,他們可以利用這些微服務,在自己的平臺上快速創建和部署定制化的應用,并能夠保留對知識產權的完整所有權和控制權。
我們不可能從頭開始編寫代碼,也不用寫一大堆Python 代碼或類似的東西。黃仁勛認為,未來如何構建軟件,只需要組建一支AI團隊就足夠了。這支AI團隊可以使用現成的 NIM 微服務構建專屬的AI和AI助手,為不同公司所需的模型提供專門訓練,幫助他們創建更好的新服務。
在GTC 2024上,NVIDIA推出了數十項企業級生成式 AI 微服務,其中包括 NVIDIA NIM? 微服務,能夠適用于 NVIDIA 及合作伙伴生態系統中 20 多個熱門的 AI 模型進行推理優化。另外,用戶現能夠以 NVIDIA CUDA-X 微服務的形式使用 NVIDIA 加速軟件開發套件、庫和工具,用于檢索增強生成(RAG)、護欄、數據處理、HPC 等。除此之外,NVIDIA 還發布了 20 多項醫療 NIM 和 CUDA-X 微服務。
1)NIM 微服務
NIM 微服務提供基于 NVIDIA 推理軟件的預構建容器,包括 Triton 推理服務器? 和 TensorRT?-LLM,使開發者能夠將部署時間從幾周縮短至幾分鐘。
在語言、語音和藥物發現等領域,NIM 微服務提供了行業標準 API,使開發者能夠使用安全托管在自己的基礎設施中的專有數據,來快速構建 AI 應用。這些應用可按需擴展,從而為在 NVIDIA 加速計算平臺上運行生產級生成式 AI 提供靈活性和性能。
除此之外,NIM 微服務還能夠為部署 NVIDIA、A121、Adept、Cohere、Getty Images 和 Shutterstock 的模型,以及谷歌、Hugging Face、Meta、微軟、Mistral AI 和 Stability AI 的開放模型提供快速且性能出色的生產級 AI 容器。
據了解,用戶可以從亞馬遜 SageMaker、谷歌 Kubernetes Engine 和微軟 Azure AI 中訪問 NIM 微服務,并與 Deepset、LangChain 和 LlamaIndex 等流行的 AI 框架集成。
由于NVIDIA NIM 軟件包是根據 NVIDIA 的加速計算庫和生成式 AI 模型構建的,因此用戶可以在 NVIDIA 龐大的 CUDA 安裝基礎上工作,針對新 GPU 進行重新優化,并不斷掃描安全漏洞和威脅。
大會現場,黃仁勛展示了NVIDIA全新的醫療微服務套件,其包含經過優化的 NVIDIA NIM? AI 模型和工作流,并提供行業標準應用編程接口(API),用于創建和部署云原生應用。NVIDIA醫療微服務套件還提供先進的醫學影像、自然語言和語音識別以及數字生物學生成、預測和模擬功能。
2)CUDA-X 微服務
CUDA-X 微服務為數據準備、定制和訓練提供端到端的構建模塊。GTC 2024上,NVIDIA推出了定制語音和翻譯 AI 的 NVIDIA Riva、用于路由優化的 NVIDIA cuOpt?,以及用于高分辨率氣候和天氣模擬的 NVIDIA Earth-2。
除此之外,NVIDIA還推出了能夠讓開發者將其 AI 應用鏈接到業務數據的NeMo Retriever?微服務,包括文本、圖像以及條形圖、折線圖和餅圖等可視化內容,以生成高度準確、與上下文相關的結果。借助當中的RAG 功能,企業可以向助手、聊天機器人和生成式 AI 生產力工具提供更多數據,從而提高準確性和洞察力。
據了解,NVIDIA面向更多的用于定制模型開發的 NVIDIA NeMo? 微服務也將陸續發布,其中包括構建用于訓練和檢索的簡潔數據集的 NVIDIA NeMo Curator、用于利用特定領域數據微調 LLM 的 NVIDIA NeMo Customizer、用于分析 AI 模型性能的 NVIDIA NeMo Evaluator 以及用于 LLM 的 NVIDIA NeMo Guardrails。
NVIDIA 微服務已經被NVIDIA 生態系統中的數據、基礎設施和計算平臺提供商使用,包括 Box、Cloudera、Cohesity、Datastax、Dropbox 和 NetApp 在內的頂級數據平臺提供商正在使用 NVIDIA 微服務,幫助客戶優化 RAG 管道,并將專有數據集成到生成式 AI 應用中。
另外,企業可以在自己選擇的基礎設施上部署 NVIDIA AI Enterprise 5.0 中的 NVIDIA 微服務,例如領先的亞馬遜云科技(AWS)、谷歌云、Azure 和 Oracle Cloud Infrastructure 等云平臺。超過 400 個 NVIDIA 認證系統也支持 NVIDIA 微服務,包括思科、戴爾科技、慧與(HPE)、惠普、聯想和超微的服務器和工作站。
黃仁勛表示,NVIDIA合作伙伴擁有多年來創建的所有這些令人驚嘆的工具(和數據)。他強調,“企業IT行業正坐在一座‘金礦’上,如果他們能把這個‘金礦’變成 AI 助手,就能給用戶提供更多可能。
3)Omniverse Cloud API
NVIDIAI Omnivers Cloud是全球領先的工業數字孿生應用和工作流創建平臺。為了幫助更多的軟件廠商加速AI研發,在GTC 2024上,NVIIDIA正式宣布通過API的方式,將該平臺的覆蓋范圍擴展至整個軟件制造商生態系統。
NIVIDIA總共推出了五個Omniverse Cloud API,它們即可以單獨使用,也可以組合作用。
USD Render:生成OpenUSD數據的全光線追蹤NVIDIA RTX?渲染
USD Write:讓用戶能夠修改OpenUSD數據并與之交互
USD Query:支持場景查詢和交互式場景
USD Notify:追蹤USD變化并提供更新信息
Omniverse Channel:連接用戶、工具和世界,實現跨場景協作。
借助五個全新 Omniverse Cloud 應用編程接口(API),開發者能夠輕松地將 Omniverse 的核心技術直接集成到現有的數字孿生設計與自動化軟件應用中,或是集成到用于測試和驗證機器人或自動駕駛汽車等自主機器的仿真工作流中。
黃仁勛在現場宣布,NVIDIA 將把 Omniverse 引入 Apple Vision Pro 中,通過新的 Omniverse Cloud API,開發者可以將交互式工業數字孿生流式傳輸到 VR 頭顯中。
GTC 2024現場,黃仁勛分享了一個機器人倉庫的演示,展示其工作原理——它使用多攝像頭感知和追蹤,看顧工人并協調機器人叉車,在整個機器人堆棧運行的情況下,這些叉車能夠實現自動駕駛。
據了解,一些全球大型工業軟件制造商正在采用 Omniverse Cloud API,包括 Ansys、Cadence、達索系統旗下 3DEXCITE 品牌、Hexagon、微軟、羅克韋爾自動化、西門子和 Trimble 等。