成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

AMD開源30億小參數(shù)模型，媲美Qwen-2.5

發(fā)布于 2025-3-19 12:06

瀏覽

0收藏

AMD在官網(wǎng)開源了最新小參數(shù)模型Instella-3B。比較特別的是，這是一個基AMD Instinct? MI300X GPU從頭訓練的模型。

根據(jù)測試數(shù)據(jù)顯示，Instella-3B的性能超過了Llama-3.2-3B、Gemma-2-2B，可以媲美阿里開源的Qwen-2.5-3B，這也證明了AMD的GPU也能訓練出高性能的大模型。

AMD開源30億小參數(shù)模型，媲美Qwen-2.5-AI.x社區(qū)

開源地址：https://huggingface.co/amd/Instella-3B

Instella-3B-SFT是經(jīng)過監(jiān)督微調(diào)的模型，使用了89.02億tokens的數(shù)據(jù)，增強了遵循指令的能力。Instella-3B-Instruct則是經(jīng)過直接偏好優(yōu)化的模型，使用了7.6億tokens的數(shù)據(jù)，使模型的輸出更符合人類偏好，增強了聊天能力。

架構(gòu)方面，Instella模型是基于文本的自回歸Transformer架構(gòu)，擁有30億參數(shù)，包含36個解碼器層，每層有32個注意力頭，支持最長4096tokens的序列長度，詞匯量約為50,000tokens。

在預訓練和微調(diào)過程中，AMD使用了FlashAttention-2、Torch Compile和bfloat16混合精度訓練，以減少內(nèi)存使用，提高計算速度和資源利用率。此外，AMD還采用了全分片數(shù)據(jù)并行（FSDP）與混合分片技術(shù)，以平衡集群內(nèi)節(jié)點間的內(nèi)存效率和節(jié)點內(nèi)通信開銷。

AMD開源30億小參數(shù)模型，媲美Qwen-2.5-AI.x社區(qū)

Instella模型的訓練分為四個階段，每個階段都逐步增強了模型從基礎(chǔ)自然語言理解到遵循指令以及與人類偏好對齊的能力。在第一階段預訓練中，AMD使用了4.065萬億tokens的數(shù)據(jù)，這些數(shù)據(jù)來自O(shè)LMoE-mix-0924，是一個涵蓋編碼、學術(shù)、數(shù)學和網(wǎng)絡(luò)爬取等領(lǐng)域的高質(zhì)量數(shù)據(jù)集組合。這一階段為Instella模型奠定了自然語言理解的基礎(chǔ)。

在第二階段預訓練中，AMD在第一階段的基礎(chǔ)上進一步訓練了模型，使用了額外的575.75億tokens的數(shù)據(jù)，這些數(shù)據(jù)來自多個高質(zhì)量和多樣化的數(shù)據(jù)集，包括Dolmino-Mix-1124、SmolLM-Corpus（python-edu）、Deepmind Mathematics以及對話數(shù)據(jù)集等。

AMD開源30億小參數(shù)模型，媲美Qwen-2.5-AI.x社區(qū)

此外，AMD還使用了內(nèi)部合成數(shù)據(jù)集，專注于數(shù)學問題。這些合成數(shù)據(jù)是通過使用GSM8k數(shù)據(jù)集的訓練集生成的，通過抽象數(shù)值、生成Python程序解決問題，并替換數(shù)值以生成新的問題-答案對。這一階段的訓練使Instella-3B模型在多個基準測試中表現(xiàn)出色，與現(xiàn)有的先進開源權(quán)重模型相比具有競爭力。

在指令微調(diào)階段，AMD使用Instella-3B作為基礎(chǔ)模型，使用89億tokens的高質(zhì)量指令-響應對數(shù)據(jù)進行了三個周期的訓練，以增強模型在交互式環(huán)境中的表現(xiàn)，使其更適合執(zhí)行用戶指令的任務(wù)。訓練數(shù)據(jù)來自多個任務(wù)和領(lǐng)域的精選數(shù)據(jù)集，確保模型能夠泛化各種指令類型。

在最后的對齊階段，AMD使用直接偏好優(yōu)化（DPO）技術(shù)，以Instella-3B-SFT為基礎(chǔ)模型，使用7.6億tokens的數(shù)據(jù)進行了訓練，以確保模型的輸出符合人類價值觀和期望，從而提高其輸出的質(zhì)量和可靠性。

Instella-3B在多個基準測試中超越了現(xiàn)有的全開源模型，并且與阿里開源的Qwen-2.5-3B能力差不多。例如，在MMLU、BBH和GSM8k等基準測試中，Instella-3B模型的表現(xiàn)優(yōu)于Llama-3.2-3B和Gemma-2-2B等模型。

AMD開源30億小參數(shù)模型，媲美Qwen-2.5-AI.x社區(qū)

經(jīng)過指令微調(diào)和對齊后的Instella-3B-Instruct模型在指令遵循任務(wù)和多輪問答任務(wù)中表現(xiàn)出色，同時在訓練數(shù)據(jù)量上更少。

本文轉(zhuǎn)自 AIGC開放社區(qū) ，作者：AIGC開放社區(qū)

原文鏈接:??https://mp.weixin.qq.com/s/UefvMir-v6Bzc--TDIyBaA??

標簽

已于2025-3-19 13:30:32修改

贊

收藏

回復

舉報

回復

相關(guān)推薦

2萬億訓練數(shù)據(jù)，120億參數(shù)！開源大模型Stable LM 2-12B

Aceryt ? 4005瀏覽 ? 0回復
70億LLaMA媲美5400億PaLM！MIT驚人研究用「博弈論」改進大模型｜ICLR 2024

duhorse ? 2614瀏覽 ? 0回復
Meta 開源最強大模型Llama 3.1，參數(shù)多達 405B，超16000塊H100訓練，燃燒數(shù)億經(jīng)費！小扎：堅定開源不動搖！

51CTO技術(shù)棧 ? 4269瀏覽 ? 0回復
沒有等來Qwen2.5，但等來了Qwen2-Math

NLP工作站 ? 2660瀏覽 ? 0回復
專用于法律的兩個開源大模型，最高1410億參數(shù)

Aceryt ? 3348瀏覽 ? 0回復
Qwen2.5系列模型開源，你值得擁有?。?！

NLP工作站 ? 9202瀏覽 ? 0回復
探索阿里通義千問 Qwen2.5：新一代開源大模型的卓越力量

穿越時空111 ? 5504瀏覽 ? 0回復
超級新星降臨：Arcee AI發(fā)布SuperNova-Medius，14億參數(shù)的小模型，大作為！

Halo咯咯 ? 2936瀏覽 ? 0回復
AMD 開源 AMD OLMo：完全開源的 1B 語言模型系列

Halo咯咯 ? 2581瀏覽 ? 0回復
超GPT-4o，1240億參數(shù)！最強開源多模態(tài)模型 Pixtral Large！

Aceryt ? 2557瀏覽 ? 0回復
開源最大AI視頻模型，130億參數(shù)，性能媲美閉源，擊敗Runway Gen-3、Luma 1.6

51CTO技術(shù)棧 ? 2717瀏覽 ? 0回復
阿里巴巴Qwen團隊發(fā)布QwQ-32B-Preview：包含320億參數(shù)的開放模型，專為解決高級推理任務(wù)而設(shè)計

Halo咯咯 ? 5066瀏覽 ? 0回復
AI Video Composer：Qwen2.5-Coder 賦能，簡易開源視頻創(chuàng)作神器來襲

穿越時空111 ? 3626瀏覽 ? 0回復
來認識一下 Ivy-VL：一種僅包含 30 億個邊緣設(shè)備參數(shù)的輕量級多模態(tài)模型

Halo咯咯 ? 2864瀏覽 ? 0回復
基于阿里開源Qwen2.5-7B-Instruct模型進行多代理RAG開發(fā)實戰(zhàn)

51CTO內(nèi)容精選 ? 2884瀏覽 ? 0回復
【AI 界大地震】AMD 開源 30 億參數(shù)大模型 Instella：性能碾壓同類，訓練成本暴跌 80%？

Halo咯咯 ? 1887瀏覽 ? 0回復
Llama 4開源王者歸來！推理、編碼打平DeepSeek V3但參數(shù)減一半，一張H100就能跑，還有巨獸2萬億參數(shù)模型！

51CTO技術(shù)棧 ? 1620瀏覽 ? 0回復
32B參數(shù)模型硬剛GPT-4o，性能驚艷

Halo咯咯 ? 2662瀏覽 ? 0回復
港大&字節(jié)開源GigaTok首次破解圖像重建與生成矛盾，30億參數(shù)登頂SOTA！

angel ? 1697瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

剛剛，OpenAI發(fā)布GPT-image-1模型，更強吉卜力版本來啦 2025-04-24 09:57:36發(fā)布
字節(jié)跳動開源多模態(tài)AI Agent—UI-TARS-1.5 2025-04-23 11:55:00發(fā)布

熱門推薦

AI Agents開源工具棧全解析~ 1回復

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網(wǎng)友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當，實測來了 0回復

上一篇：英偉達全力發(fā)展AI Agent！開源專屬大模型，最強AI工廠

下一篇：比DeepSeek、o1高3倍！首創(chuàng)無服務(wù)器強化微調(diào)，只需十幾個數(shù)據(jù)點

社區(qū)精華內(nèi)容

目錄

主站蜘蛛池模板：国产亚洲精品综合一区 | 国产精品视频播放 | 91精品国产一区二区三区 | 最新免费视频 | 亚洲一区综合 | 亚洲欧洲一区 | 亚洲精品99 | 久久久久久黄 | 在线观看视频一区二区三区 | 一区视频在线 | 国产激情网站 | 97视频在线观看网站 | 久久精品视频在线免费观看 | 91美女在线观看 | 911精品美国片911久久久 | 成人a视频片观看免费 | 久久夜视频| 久久久久久国产精品 | 中文字幕在线网 | 中文字幕一区二区三区在线观看 | 成人三级网址 | 欧美在线观看网站 | 在线看h| 国产成人叼嘿视频在线观看 | 一区二区三区国产精品 | 国产一区不卡在线观看 | 国产精品视频一区二区三区四蜜臂 | 国产在线视频在线观看 | 一区二区三区福利视频 | 久久免费精品 | 亚洲一二三区在线观看 | 日美女逼逼 | 精品二区 | 国产精品久久久久久久久久久久久 | 午夜激情视频 | 天天干狠狠干 | 久久天堂| 亚洲成人免费视频在线观看 | 日本视频免费观看 | 欧美性生活网 | 欧美日韩成人一区二区 |