成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Stability AI發布Stable Code 3B模型,沒有GPU也能本地運行

人工智能 新聞
Stable Code 3B 的性能優于類似大小的代碼模型,并且與 CodeLLaMA 7B 的性能相當,盡管其大小只有 CodeLLaMA 7B 的 40%。

在文生圖領域大火的 Stability AI,今天宣布了其 2024 年的第一個新 AI 模型:Stable Code 3B。顧名思義,Stable Code 3B 是一個擁有 30 億參數的模型,專注于輔助代碼任務。 

無需專用 GPU 即可在筆記本電腦上本地運行,同時仍可提供與 Meta 的 CodeLLaMA 7B 等大型模型具有競爭力的性能。

2023 年底,Stability AI 便開始推動更小、更緊湊、更強大模型的發展,比如用于文本生成的 StableLM Zephyr 3B 模型。

隨著 2024 年的到來,Stability AI 開年便馬不停蹄的發布 2024 年第一個大型語言模型 Stable Code 3B,其實這個模型早在去年八月就發布了預覽版 Stable Code Alpha 3B,此后 Stability AI 一直在穩步改進該技術。新版的 Stable Code 3B 專為代碼補全而設計,具有多種附加功能。

與 CodeLLaMA 7b 相比,Stable Code 3B 大小縮小了 60%,但在編程任務上達到了與前者相媲美的性能。

Stable Code 3B 在 MultiPL-E 基準上實現了 SOTA 性能(與類似大小的模型相比),例如 Stable Code 3B 在 Python、C++、JavaScript、Java、PHP 和 Rust 編程語言上的性能優于 StarCoder。

圖片

研究介紹

Stable Code 3B 基于 Stable LM 3B 訓練而成,而 Stable LM 3B 訓練 token 數達到 4 萬億,更進一步的,Stable Code 使用了軟件工程中特定的數據(包括代碼)進行訓練。

Stable Code 3B 提供了更多的特性,即使跨多種語言也表現良好,還兼具其他優勢,比如支持 FIM(Fill in the Middle ,一種新的訓練技巧)功能,還能擴展上下文大小。基礎 Stable Code 在多達 16,384 個 token 序列上進行訓練,遵循與 CodeLlama 類似的方法,即采用旋轉嵌入(Rotary Embeddings),這種方法可以選擇性的允許修改多達 1,000,000 個旋轉基(rotary base),進一步將模型的上下文長度擴展到 100k 個 token。

在模型架構方面,Stable Code 3B 模型是一個純解碼器的 transformer,類似于 LLaMA 架構,并進行了以下修改:

  • 位置嵌入:旋轉位置嵌入應用于頭嵌入維度的前 25%,以提高吞吐量;
  • Tokenizer:使用 GPTNeoX Tokenizer.NeoX 的修改版本,添加特殊 token 來訓練 FIM 功能,例如 < FIM_PREFIX>、<FIM_SUFFIX > 等。

訓練

訓練數據集

Stable Code 3B 的訓練數據集由 HuggingFace Hub 上提供的開源大規模數據集過濾混合組成,包括 Falcon RefinedWeb、CommitPackFT、Github Issues、StarCoder,并進一步用數學領域的數據補充訓練。

訓練基礎設施

  • 硬件:Stable Code 3B 在 Stability AI 集群上使用 256 個 NVIDIA A100 40GB GPU 進行訓練。
  • 軟件:Stable Code 3B 采用 gpt-neox 的分支,使用 ZeRO-1 在 2D 并行性(數據和張量并行)下進行訓練,并依賴 flash-attention、SwiGLU、FlashAttention-2 的旋轉嵌入內核。

最后,我們看一下 Stable Code 3B 的性能表現:

關于 Stable Code 3B 更詳細的技術報告會在之后發布,大家可以期待一下。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-01-17 13:32:46

AI代碼代碼生成工具

2024-03-29 12:43:15

精度代碼模型

2024-03-27 09:09:57

模型AI開源

2024-10-17 18:52:41

2023-08-09 11:53:55

AI編程工具

2024-02-05 13:24:51

GPUNLP芯片

2024-06-04 14:09:00

2025-05-27 08:30:00

AI多模態模型VLR1-3B

2024-03-05 11:31:00

AI數據

2024-06-13 09:12:48

2025-03-13 06:34:49

2025-02-07 11:00:00

模型開源AI

2025-03-13 07:30:00

谷歌Gemma 3AI 模型

2025-04-03 00:10:11

DockerAI模型

2025-02-25 12:30:00

2024-11-04 08:00:00

2025-03-19 08:00:00

2023-02-10 21:12:41

GPUmacOSStable

2024-03-25 00:03:00

生成式 AIAI
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品永久免费观看 | 福利视频一区 | 狠狠亚洲| 久久精品视频在线免费观看 | 欧美视频一区二区三区 | 日韩精品视频一区二区三区 | 9久9久9久女女女九九九一九 | 亚洲中国字幕 | 麻豆精品国产91久久久久久 | 国产精品一区二区免费 | 亚洲精品一区国语对白 | 欧美午夜久久 | 精品国产18久久久久久二百 | 精品一区二区免费视频 | 亚洲一区在线播放 | 桃花av在线| 精品久久国产 | 国产精品一区二区三区四区五区 | a精品视频 | 福利一区在线观看 | 伦理一区二区 | 毛片在线视频 | 国产日韩精品在线 | www.婷婷亚洲基地 | 国产精品国产三级国产aⅴ中文 | 国产精品视频免费 | 亚洲逼院 | 亚洲国产高清在线观看 | 羞羞午夜 | 国产日韩精品在线 | 久久国产成人 | 国产午夜精品一区二区三区嫩草 | 成人区一区二区三区 | 狠狠色综合网站久久久久久久 | 欧美国产视频一区二区 | 国产精品久久久久久婷婷天堂 | 免费的av网站 | 久久综合激情 | 日韩一二区 | 一区中文字幕 | 1级毛片 |