成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

0代碼調戲千億參數大模型,打開網頁就能玩!無需注冊即可體驗

開源
這就是由開源項目Colossal-AI支持的云端demo,無需注冊即可上手體驗,對硬件完全沒門檻,普通筆記本電腦甚至手機就能搞定。

想體驗千億參數大模型的門檻,真是越來越低了!

想讓大模型回答問題?

只需在網頁端輸入問題,運行二三十秒,答案就噌噌生成了。

圖片

用的正是今年由Meta開源的Open Pretrained Transformer(OPT),參數量達1750億。

如果是傳統在本地運行,對算力可是個大考驗。

這就是由開源項目Colossal-AI支持的云端demo,無需注冊即可上手體驗,對硬件完全沒門檻,普通筆記本電腦甚至手機就能搞定。

也就是說,完全不用懂代碼的小白,現在也能調戲OPT這樣的大模型了。

讓我們來試玩一把~

4種任務可試玩

FAQ常見問題解答、聊天機器人、翻譯、文章創作幾種模式都可試玩。

一些數值也能按需自己來調整,并且不涉及到代碼。

圖片

我們體驗了下文章創作,開頭給了一句“今天是個好日子啊”。

很快,網頁就輸出了一連串大好事,剛剛加薪、正在玩刺客信條、明天還要去海灘……看著讓人羨慕!

圖片

還能構建個場景讓聊天機器人嘮上幾塊錢的。

隨機生成的一段長對話是買手機的場景。嗯,和今天iPhone 14發布可以說是非常應景了。

圖片

感覺即便是不懂AI、不懂編程的小白也能玩轉OPT的各種任務,體驗過程相當絲滑。?

要知道,像OPT這樣千億參數大模型的運行,一直都有著“對硬件要求高”、“成本高”的特點。

一個免費無限玩的網站,到底是怎么實現如上效果的?

開源方案快速云上部署超大模型

這還是要從其背后支持系統Colossal-AI說起。

它以“僅需幾行代碼就能快速部署AI大模型訓練推理”而名震江湖,在GitHub上攬星超過4.7K。

這一次,是它在云上部署AI大模型的一次新突破。

主要針對OPT模型的特性,做出了在推理速度、計算量等方面的優化。

在OPT云上服務方面,提出了left padding、past cache、bucket batching技術。

OPT擁有1750億參數量,如此規模的模型,單個GPU顯存顯然無法容納。

圖片

而且推理問題不光要考慮吞吐量,還要顧及到時延問題。

針對這兩方面問題,并行計算是個不錯的解決思路。

尤其是Colossal-AI本身就十分擅長將一個單機模型轉換成并行運行,獲得并行OPT模型自然不成問題。

不過并行方案中的參數加載一直是個難題。

在這方面,Colossal-AI可以讓用戶只需要參考樣例,簡單提供參數名映射關系,即可完成模型參數的加載。

最后,再將模型導入到Colossal-AI的推理引擎中,設置相應的超參數。

到這一步,OPT主干網絡的推理部分就能上線且輸出有意義的結果了。

但是這還遠遠不夠。

因為OPT是生成式模型,生成式任務需要不斷循環模型的輸出結果,這就導致推理中常見的batching策略無法直接應用。

具體來看,由于生成任務輸入的語句長度往往參差不齊,而且大部分語言閱讀和書寫都是從左向右的。

如果用常規的right padding,那么針對較短的句子就很難生成有意義的結果,或者需要進行復雜處理。

圖片

△使用Right padding,生成側不對齊

如果用單batch運行,效率又太低了,不可行。

所以這一回的推理部署中,增加了left padding對句子進行填充,讓每個句子的生成側(右側)都是對齊的,同時可以生成新的單詞。

圖片

△Left padding

還有另一方面的問題——生成模型單次推理只能生成一個新詞。

當新的輸出結果生成時,它同時也成為了輸入的一部分。

也就是說,生成式任務的每次計算,是需要針對新的輸入序列進行重新計算的。

顯然這種操作方式,重復計算太多了。

尤其是對于占絕大多數計算量的Linear層來說。

所以,Colossal-AI的開發人員在模型內部引入了past cache技術。

它可以暫存同一次生成任務中的Linear層的輸出結果,讓每次只有一個新的單詞進入Linear層進行計算,并把該次的計算結果暫存,以避免重復計算。

直觀來看就是醬嬸兒的:

圖片

除此之外,開發人員還注意到生成式任務的計算量是參差不齊的。

輸入、輸出的句子長短變化范圍都很大。

如果用簡單的batching方法,將兩個相差很大的推理放在同一個批次里,就會造成大量的冗余計算。

因此他們提出了bucket batching。

即按照輸入句長以及輸出目標句長進行桶排序,同一個桶內的序列作為一個batching,以此降低冗余。

圖片

One More Thing

不光是這次的云端demo,提供支持的Colossal-AI也是免費開源的~

任何人都能基于它低成本訓練自己的大模型,并部署成云端服務。

比如在單張10GB顯存的RTX 3080上,就能訓練120億參數的大模型。

較原生PyTorch提升了120倍的模型容量。

圖片

此前Colossal-AI多次在GitHub、Paper With Code熱榜位列世界第一。

相關解決方案成功在自動駕駛、云計算、零售、 醫藥、芯片等行業知名廠商落地應用。

最近,Colossal-AI還連續入選和受邀全球超級計算機大會、國際數據科學會議、世界人工智能大會、亞馬遜云科技中國峰會等國際專業盛會。

責任編輯:姜華 來源: 量子位
相關推薦

2021-09-18 10:45:58

Windows 11Windows微軟

2021-08-10 22:49:20

Windows 11Windows微軟

2024-04-02 08:46:53

2023-07-08 23:22:51

量子位

2020-04-10 09:05:40

iOS功能代碼

2023-03-29 15:11:24

AI方案

2021-10-25 08:00:00

工具DataTrucker后端

2022-12-26 14:00:10

模型升級

2020-10-04 13:20:21

機器學習人工智能計算機

2024-11-04 11:02:56

2023-12-13 12:55:39

模型數據

2025-01-13 02:00:00

模型訓練數據

2023-09-13 10:09:00

模型數據

2023-07-05 08:47:24

Go版本團隊

2024-04-06 15:27:56

2025-06-09 10:20:12

2025-05-19 02:00:00

MCPFigma前端

2024-04-02 07:14:04

2023-08-03 19:10:15

機器人AI
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 91看片| 99国内精品 | 精品一区二区三区91 | 中文一区二区 | 欧美日韩国产在线 | 午夜国产在线 | 国产一区二区精品自拍 | 涩爱av一区二区三区 | 中文在线观看视频 | 成人毛片一区二区三区 | 一级大片网站 | 久久免费视频1 | 国产999精品久久久久久 | 欧美中文字幕一区二区三区亚洲 | 亚洲一区在线日韩在线深爱 | 日日碰狠狠躁久久躁婷婷 | 精品视频在线免费观看 | 中文字幕人成乱码在线观看 | 91久久夜色| 国产成人精品久久 | 伊人网伊人网 | 91中文| 日韩成人在线看 | 午夜视频网站 | 国产精品日韩 | 亚洲经典一区 | 国产jizz女人多喷水99 | 国产精品久久久久久久久 | 亚洲综合第一页 | 亚洲欧美日韩久久 | 日韩av电影在线观看 | 精品久久久久久中文字幕 | 男人天堂网站 | 久草网址 | 黄网站在线播放 | 一区二区视频 | 亚洲精品区| 日本高清aⅴ毛片免费 | 日韩中文字幕av | 69堂永久69tangcom | 天天影视色综合 |