成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

無須英偉達(dá),AMD本地可跑CUDA?驚現(xiàn)極客團(tuán)隊(duì)開發(fā)三方編程工具包,網(wǎng)友群議指責(zé)AMD無作為:已經(jīng)晚了,CUDA已經(jīng)是事實(shí)標(biāo)準(zhǔn)了

原創(chuàng) 精選
商務(wù)辦公
作為 NVIDIA 發(fā)明的一種并行計(jì)算平臺和編程模型,CUDA已經(jīng)憑借大模型時(shí)代成功完成了蝶變,目前基于 CUDA 的 GPU 銷量已經(jīng)達(dá)到無法完全統(tǒng)計(jì),軟件開發(fā)商、科學(xué)家以及研究人員正在各個(gè)領(lǐng)域中運(yùn)用 CUDA。

編輯 | 言征

出品 | 51CTO技術(shù)棧(微信號:blog51cto)

為了緩解“英偉達(dá)”焦慮,市場上浮現(xiàn)出了不可思議的事情。

就在今天,一個(gè)“可以讓AMD GPUs上跑CUDA的編程工具包”不脛而走,引起業(yè)界的注意。

圖片圖片

1.AMD GPU 可以本地跑英偉達(dá)的CUDA?

不需要修改 CUDA 程序,也不需要構(gòu)建系統(tǒng),通過一個(gè)編程工具包,就可以把CUDA應(yīng)用程序進(jìn)行AMD GPU的本地編譯。這個(gè)工具包就是Spectral Compute推出的SCALE。

關(guān)鍵是,SCALE的制作方還是個(gè)“AI芯片大一統(tǒng)的野心家”,表示:“當(dāng)然,AMD 只是開始,對更多 GPU 供應(yīng)商和 CUDA API 的支持正在開發(fā)中?!?/p>

據(jù)介紹,SACALE有以下幾個(gè)部分組成:一個(gè)nvcc兼容編譯器,能夠?yàn)?AMD GPU 編譯 nvcc-dialect CUDA,包括 PTX asm;針對 AMD GPU 的 CUDA 運(yùn)行時(shí)和驅(qū)動程序 API 的實(shí)現(xiàn);開源包裝器庫通過委托給相應(yīng)的 ROCm 庫來提供“CUDA-X”API。這就是和等庫的cuBLAS處理cuSOLVER方式。

測試了哪些項(xiàng)目?

SCALE 團(tuán)隊(duì)通過編譯開源 CUDA 項(xiàng)目并運(yùn)行其測試來驗(yàn)證 SCALE。并且完全通過的開原項(xiàng)目包括:NVIDIA Thrust、Blender Cycles、AMGX、llama-cpp、stdgpu等。

圖片圖片

目前支持哪些 GPU?據(jù)介紹,AMD gfx1030(Navi 21、RDNA 2.0)、AMD gfx1100(Navi 31、RDNA 3.0)已經(jīng)通過測試,AMDgfx1010、AMDgfx1101臨時(shí)測試后似乎有效。

2.那么SCALE是如何做到的?

市面上有不少跨平臺的GPGPU解決方案,比如受到英偉達(dá)官方支持的HIP方案,可以避免使用CUDA的模糊功能(如內(nèi)聯(lián)PTX)的代碼,而AMD自己,本身就有一種轉(zhuǎn)換工具:hipfy,可以將CUDA代碼轉(zhuǎn)換為hip。

那么與其他跨平臺 GPGPU 解決方案相比,SCALE 有幾個(gè)關(guān)鍵創(chuàng)新:

  • SCALE 接受原樣的 CUDA 程序。無需將它們移植到其他語言。即使您的程序使用內(nèi)聯(lián) PTX 也是如此asm。
  • SCALE 編譯器接受與 相同的命令行選項(xiàng)和 CUDA 方言nvcc,可作為替代品。
  • “模擬” NVIDIA CUDA 工具包的安裝,因此現(xiàn)有的構(gòu)建工具和腳本就可以cmake正常工作。

當(dāng)然在某些領(lǐng)域,SCALE對NVIDIA CUDA中某些功能的實(shí)現(xiàn)也有不同的行為。比如,SCALE尚不支持每個(gè)線程的默認(rèn)流行為,雖然這不會破壞程序,但可能會降低性能。而在NVIDIA GPU上運(yùn)行時(shí),則有一種也會略微提高程序性能的解決方法:即顯式使用非阻塞CUDA流,而不是依賴于隱式CUDA流。

整體上看,與其他方案有這些不同:

(1)SCALE并不提供編寫 GPGPU 軟件的新方法,而是允許使用廣受歡迎的 CUDA 語言編寫的程序直接為 AMD GPU 進(jìn)行編譯。

(2)SCALE 旨在與 NVIDIA CUDA 完全兼容。我們認(rèn)為用戶不必維護(hù)多個(gè)代碼庫或犧牲性能來支持多個(gè) GPU 供應(yīng)商。

(3)SCALE 的語言是NVIDIA CUDA 的超集,它提供了一些可選的 語言擴(kuò)展 ,可以讓那些希望擺脫的用戶更輕松、更高效地編寫 GPU 代碼nvcc。

當(dāng)然,SCALE 尚在開發(fā)中??赡軙鄙俨糠?API 而導(dǎo)致無法使用 ,不過團(tuán)隊(duì)會根據(jù)用戶提的需求加速開發(fā)。

教程文檔很詳細(xì):https://docs.scale-lang.com/

3.神奇的極客團(tuán)隊(duì)

Specrtral Compute 是一個(gè)致力于加速GPGPU和HPC工作負(fù)載的全球團(tuán)隊(duì),這個(gè)團(tuán)隊(duì)很神奇。小編翻了一下他們官網(wǎng),可謂是一群AI極客的玩法。

官網(wǎng)顯示,他們推出了一種1秒內(nèi)向全球傳送視頻的直播解決方案,還針對高吞吐量的GPU加速應(yīng)用程序后臺和低延遲CPU執(zhí)行進(jìn)行優(yōu)化,推出了最快的正則表達(dá)式引擎,而且性能不受影響;此外,這個(gè)團(tuán)隊(duì)隊(duì)員還擅長優(yōu)化你在用AI軟件,使其要么跑得更快,要么服務(wù)免費(fèi)。

4.萬能的網(wǎng)友

為什么不是AMD?但代替不了英偉達(dá)

首先,一部分人爭議的焦點(diǎn)是“怒AMD不爭”——“如果AMD采取任何行動就好了,支持這個(gè),任何一項(xiàng)都會話費(fèi)幾百萬美元,但對AMD股東來說卻價(jià)值一萬億美元?!?/p>

然而也有人認(rèn)為AMD正在努力,正如上文提到的HIP解決方案。

然而,也有部分網(wǎng)友認(rèn)為如果AMD支持這樣的編程工具或者轉(zhuǎn)換層,會是一個(gè)壞主意。

據(jù)悉,CUDA 的設(shè)計(jì)并不與供應(yīng)商無關(guān),而 Nvidia 可以在技術(shù)和法律上任意制造困難。“我認(rèn)為在此上運(yùn)行 cuDNN 或 cuBLAS 違反了許可協(xié)議。因此,這些和其他 Nvidia 庫將成為 AMD 需要重新實(shí)現(xiàn)和支持的 API 邊界的一部分。”

“追求 bug-for-bug 兼容性是愚蠢的行為。CUDA 的重要用戶是開源。AMD 可以直接在上游項(xiàng)目(如 pytorch 或 llama.cpp)中實(shí)現(xiàn)支持。一旦獲得支持,社區(qū)就可以對其進(jìn)行維護(hù)?!?/p>

5.指責(zé) AMD 而不是 Nvidia,這很奇怪嗎?

事實(shí)并非如此。

一位網(wǎng)友已經(jīng)被CUDA征服了,“即便AMD有一些努力,我也不相信 HIP 或 RocM 是 Cuda 的可行替代品?!?/p>

George Hotz 做了很多工作,試圖將各種 ML 架構(gòu)移植到 AMD,并遇到了無數(shù)的驅(qū)動程序錯(cuò)誤。問題不在于英偉達(dá)不會構(gòu)建開放平臺——問題在于 AMD 不會投資競爭平臺。

即使 CUDA 是開放的, 你是否希望 nvidia 也為 AMD 編寫驅(qū)動程序?我不相信第三方會編寫“兼容層”,因?yàn)?AMD 自己的 GPU 并未針對類似 CUDA 的工作負(fù)載進(jìn)行優(yōu)化或測試。

99%的ML工程師不會寫CUDA

99% 的 ML 工程師不會編寫 CUDA。一位業(yè)內(nèi)人士表示,對于絕大多數(shù)工作負(fù)載,Meta 可能有 20 名工程師為 Pytorch 編寫 Cuda 后端,其他每個(gè)工程師都會使用。Meta 可以再雇傭 20 名工程師來支持 AMD 擁有的一切(他們確實(shí)這樣做了,但它不如 CUDA 那么強(qiáng)大)。

真正擅長CUDA的工程師是金子一樣的貴,所以他們能做的項(xiàng)目遠(yuǎn)遠(yuǎn)超出了自己的精力和時(shí)間。甚至又網(wǎng)友爆料稱:自己認(rèn)識一位CUDA工程師配有一個(gè)滑雪屋,價(jià)值超過180鎊黃金(約532萬美元)。

也有人延伸出了對現(xiàn)有芯片編程的建議,希望趕緊加入互操作性,開發(fā)人員太需要互操作性技術(shù)了?;ゲ僮餍约夹g(shù)可以幫助目前僅支持NVIDIA GPU的軟件在未來快速添加對Intel和AMD GPU的支持。

寫在最后:英偉達(dá)的CUDA已經(jīng)成為事實(shí)上的標(biāo)準(zhǔn)

作為 NVIDIA 發(fā)明的一種并行計(jì)算平臺和編程模型,CUDA已經(jīng)憑借大模型時(shí)代成功完成了蝶變,目前基于 CUDA 的 GPU 銷量已經(jīng)達(dá)到無法完全統(tǒng)計(jì),軟件開發(fā)商、科學(xué)家以及研究人員正在各個(gè)領(lǐng)域中運(yùn)用 CUDA。

Nvidia 付出了巨大的努力,也獲得了豐厚的回報(bào)。他們與實(shí)際使用其產(chǎn)品的人密切合作,資助開發(fā)并為研究人員、教師等提供大量支持,迄今已有十年之久。

正如網(wǎng)友評論的:“ 即使 AMD 推出了各方面都更好的 CUDA 版本,它仍然不會被采用,因?yàn)?CUDA 已經(jīng)成為標(biāo)準(zhǔn)?!?/p>

“AMD 開始真正嘗試的最佳時(shí)機(jī)是 10 年前;第二佳時(shí)機(jī)是今天?!?/p>

責(zé)任編輯:武曉燕 來源: 51CTO技術(shù)棧
相關(guān)推薦

2023-06-05 07:35:03

2023-05-18 07:30:16

OpenCLGPU平臺生態(tài)

2023-10-09 13:19:51

AI軟件

2015-08-07 09:34:44

AMDLinux

2024-11-28 16:45:50

2024-07-16 13:22:42

2024-09-12 13:09:32

2024-09-10 14:00:00

英偉達(dá)架構(gòu)AI

2018-11-23 10:48:04

云計(jì)算開源云服務(wù)

2022-05-31 09:10:06

jQuery前端開發(fā)工具

2024-09-05 14:10:00

AI計(jì)算

2022-04-02 16:36:40

架構(gòu)芯片技術(shù)

2012-08-31 11:21:41

浪潮英偉達(dá)ICCE

2023-08-27 22:42:20

2011-11-16 09:49:49

AMD云計(jì)算

2023-06-02 07:04:24

宏碁映泰技嘉

2012-05-11 11:32:52

英偉達(dá)CUDA編譯器

2024-07-08 08:06:00

2022-09-01 18:20:15

GPU

2023-05-26 17:15:45

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 亚洲成人av在线播放 | 日韩精品久久久久 | 国产伦精品一区二区三区精品视频 | 色网站在线免费观看 | 亚洲国产高清在线观看 | 天天干,夜夜操 | 日韩一区二区在线视频 | 成人一区二区三区在线观看 | 玖玖在线免费视频 | 国产在线成人 | 另类二区| 日韩免费一区 | 日本一区高清 | 精品国产乱码久久久久久丨区2区 | 欧美一区二区网站 | 成人小视频在线观看 | 精品福利视频一区二区三区 | 欧美日韩高清在线一区 | 久久国产综合 | 精品美女| 久久精品国产一区二区三区 | 亚洲午夜网 | 99国产精品视频免费观看一公开 | 99reav | 久久久久久免费看 | 日韩欧美一区二区在线播放 | 久久99精品视频 | 欧美电影免费观看高清 | 日韩一区二区在线观看 | 91文字幕巨乱亚洲香蕉 | 国产精品久久久久久久久久久久冷 | 在线视频 亚洲 | 国产真实乱全部视频 | 久久精品在线播放 | 久草精品在线 | 99亚洲 | 好婷婷网 | 精品久久精品 | 欧美又大粗又爽又黄大片视频 | 久久99精品久久久久久国产越南 | 狠狠狠色丁香婷婷综合久久五月 |