研究表明每個國家都需要人工智能主權(quán)
如果你出售大量硬件來支持人工智能工作負載,那么最好的方法就是讓全球各國都相信人工智能是如此重要,以至于他們必須在自己的境內(nèi)擁有大量人工智能。以防某些政治或經(jīng)濟危機導致人工智能技術無法通過遍布全球的云構(gòu)建者獲得。
將大量GPU送到超大規(guī)模和云計算構(gòu)建者手中是擴展GenAI模型以展示其能力的最佳方式,同時也說明了GenAI對所有國家的戰(zhàn)略重要性。
隨著英偉達提高其“Hopper”和“Blackwell”GPU的產(chǎn)量,并找到了一種方法來增加其制造產(chǎn)量,以滿足超大規(guī)模和云以及政府和企業(yè)的需求,主權(quán)人工智能云的整個概念已經(jīng)開始流行起來。英偉達將是這一趨勢的最大受益者。
上個月,英偉達首席執(zhí)行官黃仁勛印度闡述了這種“主權(quán)人工智能”的觀點,宣布與印度信實工業(yè)(Reliance Industries)、印孚瑟斯(Infosys)、Yotta Data Services、塔塔通信(Tata Communications)和Tech Mahindra等主要IT公司和云提供商建立合作關系,以促進印度在整個經(jīng)濟中對人工智能的使用。
黃仁勛當時說,“印度應該制造自己的人工智能是完全有道理的,你不應該輸出數(shù)據(jù)來導入情報。”
這對這些國家來說是一件好事,讓它們控制了一項新興技術,這項技術可能在很多方面從根本上改變商業(yè)運作和社會運作的方式。主權(quán)人工智能也將是英偉達的一大勝利,因為它將在全球范圍內(nèi)傳播自己的信息,更重要的是。英偉達預計,到今年年底,其在印度的GPU部署將增長近10倍。
本周,在這家GPU制造商在東京舉行的人工智能峰會上,黃仁勛與軟銀董事長兼首席執(zhí)行官孫正義坐下來討論了軟銀和日本利用人工智能以及使用英偉達硬件和軟件來實現(xiàn)這一目標的遠大抱負。
據(jù)報道,日本官員希望通過寬松的監(jiān)管方式使日本對人工智能友好,從而吸引人工智能公司來到日本。黃和其他英偉達高管贊揚了日本的創(chuàng)新歷史,以及該國廣泛的技術和人工智能技能。
英偉達電信高級副總裁Ronnie Vasishta在視頻電話中告訴記者:“日本處于這一轉(zhuǎn)型的最前沿,采用英偉達人工智能基礎設施的日本云計算領導者將幫助日本轉(zhuǎn)型其最重要的行業(yè),并推進其主權(quán)人工智能的雄心。”
英偉達指出,它與許多日本公司在人工智能項目上有合作,但它與日本跨國公司軟銀(SoftBank)的合作占據(jù)了中心位置。軟銀將成為第一家使用英偉達的Blackwell平臺建造其第一臺超級計算機,也是該國最強大的超級計算機公司。
該公司將使用英偉達的DGXB200系統(tǒng)作為其英偉達DGX SuperPOD超級計算機的基礎,該計算機將用于其自己的生成式人工智能雄心,其他企業(yè)以及日本的大學和研究機構(gòu)也將能夠訪問。DGXB200系統(tǒng)于3月份首次推出,包括8個BlackwellGPU,這些GPU與供應商的第五代NVLink互連連接,每個GPU提供1.8TB/秒的雙向吞吐量。
該平臺還包括一個專用的RAS(可靠性、可用性和可服務性)引擎和一個用于更快數(shù)據(jù)庫查詢的解壓縮引擎。根據(jù)英偉達的說法,該平臺的人工智能模型訓練性能是其前身的3倍,推理性能是其前身的15倍。
軟銀的超級計算機還將包括英偉達的人工智能企業(yè)軟件和Quantum-2 InfiniBand網(wǎng)絡,這將使大型語言模型(LLM)的開發(fā)更加容易,這些模型可以為講日語的用戶構(gòu)建,與主權(quán)人工智能的推動保持一致。
軟銀還計劃使用英偉達的Grace-Blackwell平臺制造另一臺基于英偉達的超級計算機,該平臺包括其GB200NVL72液冷機架級系統(tǒng),該系統(tǒng)同時使用BlackwellGPU和基于arm的GraceCPU。該系統(tǒng)將用于高度計算密集型的工作負載。
兩家公司之間的另一個項目涉及軟銀和英偉達共同開發(fā)的AI-ran,這是一個同時運行人工智能和5G工作負載的電信網(wǎng)絡。
英偉達的Vasishta說,“人工智能民主化需要建立一個全國性的人工智能基礎設施。需要人工智能工廠來創(chuàng)造智能,建立和培訓服務于日本工業(yè)的新模型。不過,還需要一個傳輸網(wǎng)絡來分發(fā)智能,使人工智能推理盡可能接近端點。人工智能應用程序需要通過人工智能本地端點來消耗智能。”
該網(wǎng)絡使用軟件定義的5G無線電堆棧,其中包括基于英偉達Aerial加速平臺的L1軟件。兩家公司在日本某地區(qū)對AI-ran網(wǎng)絡進行了室外測試,測試了運營商級5G性能,并對網(wǎng)絡的剩余容量進行了AI推理工作。軟銀估計,傳統(tǒng)電信網(wǎng)絡的設計初衷是處理高峰負荷,通常只使用了三分之一的容量。
軟銀表示,將整合到環(huán)境中的英偉達Aeria RAN計算機-1系統(tǒng)將比運行傳統(tǒng)5G網(wǎng)絡的基礎設施節(jié)省40%的電力。孫正義在與黃仁勛表示:“有了我們緊密相連的這個智能網(wǎng)絡,它將成為日本基礎設施智能的一個大神經(jīng)大腦。”
對于電信公司來說,它開辟了其他收入來源,因為能夠在相同的網(wǎng)絡上運行這些人工智能工作負載。英偉達和軟銀都估計,在新的AI-ran基礎設施上每投資1美元,電信公司就能從AI推理收入中獲得約5美元的回報。軟銀集團估計,每增加一臺AI-RAN服務器,它將獲得高達291%的回報。
英偉達還與GMO互聯(lián)網(wǎng)集團、KDDI和櫻花互聯(lián)網(wǎng)等云計算公司建立了合作伙伴關系,以建立一個基于英偉達硬件和軟件的全國性人工智能基礎設施網(wǎng)絡,推動日本機器人、醫(yī)療保健和藥物研究等領域的人工智能創(chuàng)新。