成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

3140參數Grok-1推理加速3.8倍,PyTorch+HuggingFace版來了

人工智能 新聞
Grok-1使用Rust+JAX構建,對于習慣Python+PyTorch+HuggingFace等主流軟件生態的用戶上手門檻高。

馬斯克說到做到開源Grok-1,開源社區一片狂喜。

但基于Grok-1做改動or商用,都還有點難題:

Grok-1使用Rust+JAX構建,對于習慣Python+PyTorch+HuggingFace等主流軟件生態的用戶上手門檻高。

圖片

△圖注:Grok登上GitHub熱度榜世界第一

Colossal-AI團隊最新成果,解大家燃眉之急,提供方便易用的Python+PyTorch+HuggingFace Grok-1,能將推理時延加速近4倍

現在,模型已在HuggingFace、ModelScope上發布。

HuggingFace下載鏈接:
https://huggingface.co/hpcai-tech/grok-1

ModelScope下載鏈接:
https://www.modelscope.cn/models/colossalai/grok-1-pytorch/summary

性能優化

結合Colossal-AI在AI大模型系統優化領域的豐富積累,已迅速支持對Grok-1的張量并行。

在單臺8H800 80GB服務器上,推理性能相比JAX、HuggingFace的auto device map等方法,推理時延加速近4倍

圖片

使用教程

下載安裝Colossal-AI后,啟動推理腳本即可。

./run_inference_fast.sh hpcaitech/grok-1

模型權重將會被自動下載和加載,推理結果也能保持對齊。如下圖中Grok-1 greedy search的運行測試。

圖片

更多詳情可參考grok-1使用例:
https://github.com/hpcaitech/ColossalAI/tree/main/examples/language/grok-1

龐然大物Grok-1

此次開源,xAI發布了Grok-1的基本模型權重和網絡架構。

具體來說是2023年10月預訓練階段的原始基礎模型,沒有針對任何特定應用(例如對話)進行微調。

結構上,Grok-1采用了混合專家(MoE)架構,包含8個專家,總參數量為314B(3140億),處理Token時,其中的兩個專家會被激活,激活參數量為86B。

單看這激活的參數量,就已經超過了密集模型Llama 2的70B,對于MoE架構來說,這樣的參數量稱之為龐然大物也毫不為過。

更多參數信息如下:

  • 窗口長度為8192tokens,精度為bf16
  • Tokenizer vocab大小為131072(2^17),與GPT-4接近;
  • embedding大小為6144(48×128);
  • Transformer層數為64,每層都有一個解碼器層,包含多頭注意力塊和密集塊;
  • key value大小為128;
  • 多頭注意力塊中,有48 個頭用于查詢,8 個用于KV,KV 大小為 128;
  • 密集塊(密集前饋塊)擴展因子為8,隱藏層大小為32768

圖片

在GitHub頁面中,官方提示,由于模型規模較大(314B參數),需要有足夠GPU和內存的機器才能運行Grok。

這里MoE層的實現效率并不高,選擇這種實現方式是為了避免驗證模型的正確性時需要自定義內核。

模型的權重文件則是以磁力鏈接的形式提供,文件大小接近300GB。

圖片

值得一提的是,Grok-1采用的是Apache 2.0 license,商用友好。

目前Grok-1在GitHub上的標星已達到43.9k Stars。

量子位了解,Colossal-AI將在近期進一步推出對Grok-1在并行加速、量化降低顯存成本等優化,歡迎持續關注。

Colossal-AI開源地址:https://github.com/hpcaitech/ColossalAI

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-03-18 08:47:34

馬斯克GrokOpenAI

2024-06-28 13:42:07

2024-03-18 10:17:00

開源AI

2024-03-18 15:00:48

Grok現已開源Grok-1混合專家模型

2024-01-24 13:11:00

AI模型

2024-03-28 12:53:00

AI數據

2025-01-08 13:15:02

2024-03-19 14:00:59

2024-07-19 09:59:31

2019-09-02 14:58:03

深度學習編程人工智能

2023-12-11 15:40:32

PyTorch代碼大模型

2025-06-11 09:15:51

2024-11-25 08:30:00

2023-12-03 08:49:38

微軟開源

2023-09-01 15:22:49

人工智能數據

2024-07-08 13:04:01

2023-06-21 13:20:14

系統模型

2023-11-30 18:25:57

數據訓練

2024-12-26 16:00:00

英特爾推理模型

2024-09-19 13:32:24

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 91精品国产乱码久久久久久久久 | 中文字幕在线精品 | 欧美久久精品一级c片 | 亚洲一区国产精品 | 成人精品久久日伦片大全免费 | 久久久久综合 | 亚洲综合色 | 亚洲一区毛片 | 久久精品视频在线观看 | 日韩欧美一区二区三区四区 | 蜜桃视频成人 | 中文字幕乱码视频32 | 国产精品久久久久久久久久 | 国产一区二区三区视频在线观看 | 99re视频在线 | 操射视频 | 久久精品国产久精国产 | 欧美激情精品久久久久久变态 | 狠狠色香婷婷久久亚洲精品 | 亚洲一区视频在线播放 | 国户精品久久久久久久久久久不卡 | 国产成人高清成人av片在线看 | 我想看一级黄色毛片 | 久久亚洲欧美日韩精品专区 | 97在线观视频免费观看 | 国产精品亚洲精品日韩已方 | 亚洲综合色自拍一区 | 欧美日韩不卡合集视频 | 亚洲成人99 | 成人国产精品久久 | 久久人| 日本久久黄色 | 日韩成人在线网站 | 欧美 中文字幕 | 亚洲 欧美 另类 综合 偷拍 | 丁香婷婷久久久综合精品国产 | 久久中文字幕一区 | 成av在线 | 精品三区| 亚洲一区二区高清 | 亚洲精品在线看 |