成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

世界超大AI芯片打破單設備訓練大模型記錄 ,Cerebras要「殺死」GPU

人工智能 新聞
這塊全世界最大的加速器芯片采用7nm制程工藝,由一整塊方形的晶圓刻蝕而成。

本文轉自雷鋒網,如需轉載請至雷鋒網官網申請授權。

以造出世界上最大加速器芯片CS-2 Wafer Scale Engine聞名的公司Cerebras昨日宣布他們已經在利用“巨芯”進行人工智能訓練上走出了重要的一步。該公司訓練出了單芯片上全世界最大的NLP(自然語言處理)AI模型。

該模型具有20億個參數,基于CS-2芯片進行訓練。這塊全世界最大的加速器芯片采用7nm制程工藝,由一整塊方形的晶圓刻蝕而成。它的大小數百倍于主流芯片,具有15KW的功率。它集成了2.6萬億個7nm晶體管,封裝了850000個內核和40GB內存。

世界最大AI芯片打破單設備訓練大模型記錄 ,Cerebras要「殺死」GPU

圖1 CS-2 Wafer Scale Engine芯片

單芯片訓練AI大模型新紀錄

NLP模型的開發是人工智能中的一個重要領域。利用NLP模型,人工智能可以“理解”文字含義,并進行相應的動作。OpenAI的DALL.E模型就是一個典型的NLP模型。這個模型可以將使用者的輸入的文字信息轉化為圖片輸出。

比如當使用者輸入“牛油果形狀的扶手椅”后,AI就會自動生成若干與這句話對應的圖像。

世界最大AI芯片打破單設備訓練大模型記錄 ,Cerebras要「殺死」GPU

圖:AI接收信息后生成的“牛油果形狀扶手椅”圖片

不止于此,該模型還能夠使AI理解物種、幾何、歷史時代等復雜的知識。

但要實現這一切并不容易,NLP模型的傳統開發具有極高的算力成本和技術門檻。

實際上,如果只討論數字,Cerebras開發的這一模型20億的參數量在同行的襯托下,顯得有些平平無奇。

前面提到的DALL.E模型具有120億個參數,而目前最大的模型是DeepMind于去年年底推出的Gopher,具有2800億個參數。

但除去驚人的數字外,Cerebras開發的NLP還有一個巨大的突破:它降低了NLP模型的開發難度。

「巨芯」如何打敗GPU?

按照傳統流程,開發NLP模型需要開發者將巨大的NLP模型切分若干個功能部分,并將他們的工作負載分散到成百上千個圖形處理單元上。

數以千百計的圖形處理單元對廠商來說意味著巨大的成本。

技術上的困難也同樣使廠商們痛苦不堪。

切分模型是一個定制的問題,每個神經網絡、每個GPU的規格、以及將他們連接(或互聯)在一起的網絡都是獨一無二的,并且不能跨系統移植。

廠商必須在第一次訓練前將這些因素統統考慮清楚。

這項工作極其復雜,有時候甚至需要幾個月的時間才能完成。

Cerebras表示這是NLP模型訓練中“最痛苦的方面之一”。只有極少數公司擁有開發NLP所必要的資源和專業知識。對于人工智能行業中的其他公司而言,NLP的訓練則太昂貴、太耗時且無法使用。

但如果單個芯片就能夠支持20億個參數的模型,就意味著不需要使用海量的GPU分散訓練模型的工作量。這可以為廠商節省數千個GPU的訓練成本和相關的硬件、擴展要求。同時這也使廠商不必經歷切分模型并將其工作負載分配給數千個GPU的痛苦。

Cerebras也并未僅僅執拗于數字,評價一個模型的好壞,參數的數量并不是唯一標準。

比起希望誕生于“巨芯”上的模型“努力”,Cerebras更希望的是模型“聰明”。

之所以Cerebras能夠在參數量上取得爆炸式增長,是因為利用了權重流技術。這項技術可以將計算和內存的占用量解耦,并允許將內存擴展到足以存儲AI工作負載中增加的任何數量的參數。

由于這項突破,設置模型的時間從幾個月減少到了幾分鐘。并且開發者在GPT-J和GPT-Neo等型號之間“只需幾次按鍵”就可以完成切換。這讓NLP的開發變得更加簡單。

這使得NLP領域出現了新的變化。

正如Intersect360 Research 首席研究官 Dan Olds 對Cerebras取得成就的評價:“Cerebras 能夠以具有成本效益、易于訪問的方式將大型語言模型帶給大眾,這為人工智能開辟了一個激動人心的新時代。”

責任編輯:張燕妮 來源: 雷鋒網
相關推薦

2022-06-25 21:17:15

人工智能訓練

2025-01-09 08:01:10

2021-08-25 17:14:28

芯片AI技術

2021-10-15 15:26:10

AI 數據人工智能

2009-05-19 15:49:43

開源數據記錄

2019-10-14 15:19:56

AI 數據人工智能

2025-04-01 09:54:09

AI算法大模型AI

2023-11-17 17:02:21

微軟AI芯片

2021-07-13 09:36:26

神經網絡PyTorch框架

2024-09-05 14:05:00

AI算力

2024-06-12 09:52:49

2023-08-30 13:09:43

AI數據

2023-09-07 13:35:00

生成式AI

2020-05-18 10:30:16

AI 神經計算人工智能

2024-03-20 11:07:57

AI計算CPUGPU

2021-11-22 10:53:07

數字化

2020-08-21 17:17:30

騰訊云公有云人工智能

2024-12-25 08:02:17

人工智能AI運維

2024-10-16 09:50:32

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久久国产精品 | 性做久久久久久免费观看欧美 | 黄色大片免费观看 | 成人亚洲精品久久久久软件 | 黄色福利 | 亚洲国产精品99久久久久久久久 | 日韩成人免费av | 日韩中文字幕视频 | 成人免费一区二区三区牛牛 | 国产一区二区在线视频 | 成人午夜激情 | 丁香六月激情 | 国产重口老太伦 | 羞羞的视频网站 | 精品一区二区三区在线视频 | 久久9视频 | 亚洲一区高清 | 国产小视频在线观看 | 韩国成人在线视频 | 亚洲成人免费 | 国产资源一区二区三区 | 欧美成人精品一区二区男人看 | 中文一区| 国产精品视频中文字幕 | 国产一区二区三区视频在线观看 | 国产在线91 | 国产91视频播放 | 在线观看中文字幕一区二区 | 国产乱码精品一区二区三区中文 | 成人一级黄色毛片 | 欧美一区二区三区在线视频 | 99久热在线精品视频观看 | 国产精品久久 | 黄色在线观看国产 | 在线观看国产 | 欧美日韩精品一区二区三区四区 | 亚洲 欧美 日韩在线 | 日韩视频一区二区三区 | 亚洲精品成人 | 日本午夜一区二区三区 | 欧美一级免费看 |