成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<ol id="66161"><dl id="66161"></dl></ol>

<cite id="66161"></cite>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專(zhuān)欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專(zhuān)業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

Llama 3突然來(lái)襲！開(kāi)源社區(qū)再次沸騰：GPT-4級(jí)別模型可以自由訪問(wèn)的時(shí)代到來(lái)

發(fā)布于 2024-4-19 09:58

瀏覽

0收藏

Llama 3來(lái)了！

?

就在剛剛，Meta官網(wǎng)上新，官宣了Llama 3 80億和700億參數(shù)版本。

Llama 3突然來(lái)襲！開(kāi)源社區(qū)再次沸騰：GPT-4級(jí)別模型可以自由訪問(wèn)的時(shí)代到來(lái)-AI.x社區(qū)

并且推出即為開(kāi)源SOTA：

Meta官方數(shù)據(jù)顯示，Llama 3 8B和70B版本在各自參數(shù)規(guī)模上超越一眾對(duì)手。

8B模型在MMLU、GPQA、HumanEval等多項(xiàng)基準(zhǔn)上均勝過(guò)Gemma 7B和Mistral 7B Instruct。

而70B模型則超越了閉源的當(dāng)紅炸子雞Claude 3 Sonnet，和谷歌的Gemini Pro 1.5打得有來(lái)有回。

Llama 3突然來(lái)襲！開(kāi)源社區(qū)再次沸騰：GPT-4級(jí)別模型可以自由訪問(wèn)的時(shí)代到來(lái)-AI.x社區(qū)

Huggingface鏈接一出，開(kāi)源社區(qū)再次沸騰。

眼尖的盲生們還第一時(shí)間發(fā)現(xiàn)了華點(diǎn)：

Meta更藏了一手4000億參數(shù)+的Llama 3版本，不遜于Claude 3超大杯Opus的那種！

Llama 3突然來(lái)襲！開(kāi)源社區(qū)再次沸騰：GPT-4級(jí)別模型可以自由訪問(wèn)的時(shí)代到來(lái)-AI.x社區(qū)

AI寫(xiě)作助手創(chuàng)企HyperWriteAI的CEO見(jiàn)此已忍不住感慨：

我們正在步入一個(gè)新世界，一個(gè)GPT-4級(jí)別的模型開(kāi)源并且可以自由訪問(wèn)的世界。

Llama 3突然來(lái)襲！開(kāi)源社區(qū)再次沸騰：GPT-4級(jí)別模型可以自由訪問(wèn)的時(shí)代到來(lái)-AI.x社區(qū)

英偉達(dá)科學(xué)家Jim Fan則認(rèn)為，還在訓(xùn)練中的Llama 3 400B將成為開(kāi)源大模型的分水嶺，改變很多學(xué)界研究和初創(chuàng)公司的發(fā)展方式。

Llama 3突然來(lái)襲！開(kāi)源社區(qū)再次沸騰：GPT-4級(jí)別模型可以自由訪問(wèn)的時(shí)代到來(lái)-AI.x社區(qū)

全面取得SOTA，但8k窗口

更多技術(shù)細(xì)節(jié)，Meta在博客文章中給出。

架構(gòu)層面，Llama 3選擇了經(jīng)典的僅解碼（decoder-only）式Transformer架構(gòu)，采用包含128K token詞匯表的分詞器。

訓(xùn)練數(shù)據(jù)上看，Llama 3的訓(xùn)練數(shù)據(jù)規(guī)模達(dá)到了15T tokens，全部來(lái)自于公開(kāi)信息，其中5%為非英文數(shù)據(jù)，涵蓋30多種語(yǔ)言。

Llama 3的數(shù)據(jù)量比Llama 2的訓(xùn)練數(shù)據(jù)多7倍，其中代碼比Llama 2多4倍。

此外，為了提高 Llama 3 模型的推理效率，Meta AI還采用了分組查詢(xún)注意力 (GQA)機(jī)制，在8192個(gè)tokens的序列上訓(xùn)練模型，并使用掩碼確保自注意力不會(huì)跨越文檔邊界。

Llama 3突然來(lái)襲！開(kāi)源社區(qū)再次沸騰：GPT-4級(jí)別模型可以自由訪問(wèn)的時(shí)代到來(lái)-AI.x社區(qū)

結(jié)果，無(wú)論是8B還是70B版本，Llama 3相較于近似規(guī)模的上一代Llama 2，都取得了重大飛躍。

在迄今為止的8B和70B參數(shù)規(guī)模的模型中，Llama 3都成為了新的SOTA模型。

在語(yǔ)言（MMLU）、知識(shí)（GPQA）、編程（HumanEval）、數(shù)學(xué)（GSM-8K、MATH）等能力上，Llama 3幾乎全面領(lǐng)先于同等規(guī)模的其他模型。

Llama 3突然來(lái)襲！開(kāi)源社區(qū)再次沸騰：GPT-4級(jí)別模型可以自由訪問(wèn)的時(shí)代到來(lái)-AI.x社區(qū)

除了這些常規(guī)的數(shù)據(jù)集，Meta AI還評(píng)估了Llama 3在現(xiàn)實(shí)場(chǎng)景中的性能，并為此研發(fā)了一套高質(zhì)量的測(cè)試數(shù)據(jù)集。

這個(gè)測(cè)試集包含了1800條數(shù)據(jù)，涵蓋代碼、推理、寫(xiě)作、總結(jié)等12 個(gè)關(guān)鍵用例，并針對(duì)開(kāi)發(fā)團(tuán)隊(duì)保密。

結(jié)果，Llama 3不僅大幅超越Llama 2，也戰(zhàn)勝了Claude 3 Sonnet、Mistral Medium和GPT-3.5這些知名模型。

Llama 3突然來(lái)襲！開(kāi)源社區(qū)再次沸騰：GPT-4級(jí)別模型可以自由訪問(wèn)的時(shí)代到來(lái)-AI.x社區(qū)

而在AGIEval、BIG-Bench、ARC-Challenge這些更高階、更困難的數(shù)據(jù)集上，Llama 3的表現(xiàn)同樣可圈可點(diǎn)。

8B版本在這些任務(wù)上超越了Mistral和Gemma，70B版本則戰(zhàn)勝了Gemini Pro和MoE架構(gòu)的Mixtral，分別斬獲相應(yīng)規(guī)模的SOTA。

Llama 3突然來(lái)襲！開(kāi)源社區(qū)再次沸騰：GPT-4級(jí)別模型可以自由訪問(wèn)的時(shí)代到來(lái)-AI.x社區(qū)

不過(guò)美中不足的是，Llama 3的上下文窗口只有8k，這與現(xiàn)在動(dòng)輒幾十上百萬(wàn)窗口的大模型相比，仿佛還停留在上一代（手動(dòng)狗頭）。

Llama 3突然來(lái)襲！開(kāi)源社區(qū)再次沸騰：GPT-4級(jí)別模型可以自由訪問(wèn)的時(shí)代到來(lái)-AI.x社區(qū)

但也不必過(guò)度擔(dān)憂(yōu)，Matt Shumer就對(duì)此持樂(lè)觀態(tài)度，他表示相信在開(kāi)源社區(qū)的努力下，窗口長(zhǎng)度很快就會(huì)擴(kuò)展上去。

Llama 3突然來(lái)襲！開(kāi)源社區(qū)再次沸騰：GPT-4級(jí)別模型可以自由訪問(wèn)的時(shí)代到來(lái)-AI.x社區(qū)

Llama迎來(lái)官方網(wǎng)頁(yè)版

目前，Llama 3兩種參數(shù)量的基礎(chǔ)和Instruct版本都已上線Hugging Face可供下載。

此外，微軟Azure、谷歌云、亞馬遜AWS、英偉達(dá)NIM等云服務(wù)平臺(tái)也將陸續(xù)上線Llama 3。

同時(shí)，Meta還表示Llama 3會(huì)得到英特爾、英偉達(dá)、AMD、高通等多家廠商提供的硬件平臺(tái)支持。

Llama 3突然來(lái)襲！開(kāi)源社區(qū)再次沸騰：GPT-4級(jí)別模型可以自由訪問(wèn)的時(shí)代到來(lái)-AI.x社區(qū)

值得一提的是，此次與基礎(chǔ)模型一同發(fā)布的，還有基于Llama 3的官方Web版本，名字就叫Meta AI。

Llama 3突然來(lái)襲！開(kāi)源社區(qū)再次沸騰：GPT-4級(jí)別模型可以自由訪問(wèn)的時(shí)代到來(lái)-AI.x社區(qū)

目前該平臺(tái)有對(duì)話(huà)和繪畫(huà)兩大功能，只用對(duì)話(huà)的話(huà)無(wú)需注冊(cè)登錄、即開(kāi)即用，使用繪畫(huà)功能則需要先登錄賬號(hào)。

Llama 3突然來(lái)襲！開(kāi)源社區(qū)再次沸騰：GPT-4級(jí)別模型可以自由訪問(wèn)的時(shí)代到來(lái)-AI.x社區(qū)

不過(guò)，目前該平臺(tái)還不支持中文，也暫未上線文本上傳等功能。

Llama 3突然來(lái)襲！開(kāi)源社區(qū)再次沸騰：GPT-4級(jí)別模型可以自由訪問(wèn)的時(shí)代到來(lái)-AI.x社區(qū)

代碼方面，該平臺(tái)也能夠運(yùn)行一些簡(jiǎn)單的Python程序，但似乎只能輸出文本，涉及到繪圖這樣的任務(wù)就無(wú)法運(yùn)行了。

Llama 3突然來(lái)襲！開(kāi)源社區(qū)再次沸騰：GPT-4級(jí)別模型可以自由訪問(wèn)的時(shí)代到來(lái)-AI.x社區(qū)

總得來(lái)看，這個(gè)網(wǎng)頁(yè)版本還比較初級(jí)，但也不妨期待一波后面的更新。

One More Thing

一個(gè)小插曲是，其實(shí)在Meta官宣前幾個(gè)小時(shí)，微軟的Azure市場(chǎng)已經(jīng)偷跑了Llama 3 8B Instruct版本的消息。

Llama 3突然來(lái)襲！開(kāi)源社區(qū)再次沸騰：GPT-4級(jí)別模型可以自由訪問(wèn)的時(shí)代到來(lái)-AI.x社區(qū)

開(kāi)源模型機(jī)器學(xué)習(xí)在線平臺(tái)Replicate上的Llama 3價(jià)格表也被網(wǎng)友們第一時(shí)間扒拉了出來(lái)。

Llama 3突然來(lái)襲！開(kāi)源社區(qū)再次沸騰：GPT-4級(jí)別模型可以自由訪問(wèn)的時(shí)代到來(lái)-AI.x社區(qū)

但很快，這些“小道消息”就都被404了。

好在烏龍完了，官方也沒(méi)拖著，關(guān)心開(kāi)源大模型的小伙伴們，可以造作起來(lái)了（doge）。

本文轉(zhuǎn)自量子位，作者：量子位

原文鏈接:??https://mp.weixin.qq.com/s/r6aradJU83GvvVwkFkLXKQ??

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

港中文深圳提出ALLaVA-4V：百萬(wàn)級(jí)別的開(kāi)源多模態(tài)GPT-4V數(shù)據(jù)集

kcoufee ? 2649瀏覽 ? 0回復(fù)
首個(gè)開(kāi)源世界模型！百萬(wàn)級(jí)上下文，長(zhǎng)視頻理解吊打GPT-4，UC伯克利華人一作

duhorse ? 3291瀏覽 ? 0回復(fù)
超越GPT-4！最強(qiáng)大模型 Claude 3 完全解讀

開(kāi)發(fā)者阿橙 ? 6444瀏覽 ? 0回復(fù)
Reka Core登場(chǎng)：挑戰(zhàn)GPT-4、Claude 3

duhorse ? 3004瀏覽 ? 0回復(fù)
Meta 發(fā)布Llama 3，能力直逼GPT-4,一己之力拉高開(kāi)源大模型水位

51CTO技術(shù)棧 ? 4382瀏覽 ? 0回復(fù)
大模型一對(duì)一戰(zhàn)斗75萬(wàn)輪，GPT-4奪冠，Llama 3位列第五

Crystalcxt ? 3944瀏覽 ? 0回復(fù)
國(guó)產(chǎn)開(kāi)源MoE指標(biāo)炸裂：GPT-4級(jí)別能力，API價(jià)格僅百分之一

Crystalcxt ? 2728瀏覽 ? 0回復(fù)
Altman首提GPT-7設(shè)想：每個(gè)人都可以訪問(wèn)其計(jì)算資源！

51CTO技術(shù)棧 ? 2975瀏覽 ? 0回復(fù)
OpenAI開(kāi)源GPT-4 SAE，提供1600萬(wàn)個(gè)解釋模式

Aceryt ? 4245瀏覽 ? 0回復(fù)
LLM 評(píng)估匯總：真的吊打 LLaMA-3，媲美 GPT-4 嗎？

amei2000go ? 6941瀏覽 ? 0回復(fù)
GPT-4系列模型，在文檔理解中的多維度評(píng)測(cè)

Aceryt ? 2495瀏覽 ? 0回復(fù)
Claude3.5突然發(fā)布！GPT-4o不香了

Crystalcxt ? 3324瀏覽 ? 0回復(fù)
OpenAI 突然宣布阻止中國(guó)訪問(wèn)API服務(wù)！

51CTO技術(shù)棧 ? 3113瀏覽 ? 0回復(fù)
8B尺寸達(dá)到GPT-4級(jí)性能！北大等提出醫(yī)療專(zhuān)家模型訓(xùn)練方法

duhorse ? 2347瀏覽 ? 0回復(fù)
如何通過(guò)壓縮提示降低GPT-4的成本

51CTO內(nèi)容精選 ? 2885瀏覽 ? 0回復(fù)
不用魔法，直接訪問(wèn)微軟 Copilot GPT-4

丟翅膀的魚(yú) ? 1554瀏覽 ? 0回復(fù)
DeepSeek開(kāi)源新版V3，再次震驚國(guó)外

Aceryt ? 1632瀏覽 ? 0回復(fù)
Llama 4三大模型來(lái)襲，開(kāi)源免費(fèi)還超能打

Halo咯咯 ? 2520瀏覽 ? 0回復(fù)
llama 4， 開(kāi)源！

NLP前沿1 ? 1535瀏覽 ? 0回復(fù)

這個(gè)用戶(hù)很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

何愷明開(kāi)辟分形圖像生成新范式！計(jì)算效率提高4000倍，首次實(shí)現(xiàn)高分辨率逐像素生成 2025-02-26 11:59:41發(fā)布
達(dá)摩院開(kāi)源VideoLLaMA3：僅7B大小，視頻理解拿下SOTA | 在線可玩 2025-02-14 13:02:21發(fā)布

熱門(mén)推薦

AI Agents開(kāi)源工具棧全解析~ 1回復(fù)

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒(méi)問(wèn)題 0回復(fù)

Deepseek R1 0528實(shí)測(cè)：性能直逼頂尖，普通電腦本地運(yùn)行全攻略 0回復(fù)

本命周！MiniMax M1有多猛？網(wǎng)友：僅用40k思考預(yù)算就干翻Gemini，實(shí)測(cè)：真·超DS！ 1回復(fù)

DeepSeek 新模型 R1-0528 悄悄開(kāi)源，與o3 相當(dāng)，實(shí)測(cè)來(lái)了 0回復(fù)

上一篇： Pika聯(lián)創(chuàng)參與新研究：Diffusion能搶GPT的活了！成功挑戰(zhàn)自回歸文本范式

下一篇：微軟炸裂級(jí)單圖生數(shù)字人，Sora同款思路，“比AI劉強(qiáng)東還真”

社區(qū)精華內(nèi)容

目錄

主站蜘蛛池模板：国产精品av久久久久久久久久 | 亚洲三级免费看 | 久久久国产一区二区三区 | 区一区二区三在线观看 | 精品国产黄a∨片高清在线成人区精品一区二区婷婷日本一区二区视频 | 日本一区二区高清视频 | 亚洲国产成人精品久久久国产成人一区 | 亚洲精品一 | 欧美日韩在线免费观看 | 国产精品久久久久久网站 | www.青青草| 一区二区在线免费观看 | 国产无人区一区二区三区 | 日韩精品一区二区三区视频播放 | 欧美精品一区二区免费视频 | 亚洲精品中文在线 | 黄色毛片免费看 | 成人精品鲁一区一区二区 | 日韩在线免费看 | 欧美日韩在线一区二区 | 亚洲精品中文字幕在线观看 | 看片地址| 久久久久国 | 午夜无码国产理论在线 | 国产在线二区 | 天天插日日操 | 毛片免费观看 | 99热在这里只有精品 | 国产精品视频网址 | 国产欧美日韩精品在线观看 | 亚洲一区二区在线 | 日韩影院在线观看 | 国产在线视频99 | 午夜免费网站 | 久久久久久久电影 | www.youjizz.com日韩| 91在线视频精品 | 天天拍天天操 | 欧美成人精品一区二区三区 | 亚洲成人综合网站 | 亚洲国产一区在线 |

<mark id="66616"><option id="66616"></option></mark>

<output id="66616"></output>

<mark id="66616"><option id="66616"></option></mark>

<label id="66616"></label>