成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

賬號設置退出

網友縫合Llama3 120B竟意外能打，輕松擊敗GPT2-chatbot和GPT-4

作者：量子位 2024-05-13 12:38:08

人工智能新聞

最近這樣一個號稱是「Llama3-120b」的神秘大模型火了起來，原因在于它表現太出色了。

Llama 3首發陣容里沒有的120B型號竟意外“曝光”，而且十分能打？！

最近這樣一個號稱是「Llama3-120b」的神秘大模型火了起來，原因在于它表現太出色了——

輕松擊敗GPT-4、gpt2-chatbot那種。

比如，面對像「觀察希格斯場是否會改變其狀態」這樣的艱深難題時。

GPT-4冷酷而決絕：No；

但Llama3-120b就不一樣了，“只有當我們質疑量子力學的哥本哈根解釋時，讓我來解釋一下……”

還有就是讓LIama3-120B解釋笑話，并同兩個gpt2-chatbot比較：im-a-good-gpt2-chatbot；im-also-a-good-gpt2-chatbot。

I randomly walked past the grave of bayes yesterday, but being a frequentist i didn’t bother taking a photo。

（昨天我偶然路過貝葉斯墓，但我是頻率學派，懶得拍照。）

首先，他們三個都判斷出這是關于兩種統計學派的笑話，以及兩個學派是相對對立的情況：
Frequentist頻率學派只關注從抽樣/實驗的結果中提取信息，Bayesian貝葉斯學派還會設置一個主觀的先驗信息。

但兩個gpt2-chatbot給出進一步解釋是，正是因為頻率學派并不認同對貝葉斯理論，所以對貝葉斯墓不感興趣，更不會以他為榮而拍照。

而LIama3-120B精準指出笑點在“ i didn’t bother taking a photo”，并給出了更深一層的解釋。

因為作為頻率學派，會認為碰到貝葉斯墓的概率幾乎為零。這樣的小概率事件也不值得去拍照或者干一些有意義的事情。

哦莫，說的好有道理……

另外題外話，它的回答格式十分工整，讓人看了賞心悅目。

除此之外，網友發現它還能創造出谷歌搜到0結果的新單詞。

以及直接回答含糊的問題，不用交代背景，這不比ChatGPT好多了。

（沒有說ChatGPT不好的意思）

有評測過后的網友感嘆：它太聰明了，我不會再擺弄它了。因為它有自己的想法。

這真的是我用過最聰明的大模型了。

有網友找了半天也找不到官方來源……

與此同時，更多版本也開始出現了，比如170B、225B…嗯，一版更比一版強。

Llama 3 120B竟意外能打

這兩天，社交網絡上出現了各種關于Llama3 120B玩法。

比如推導解釋一些理論，Omega假設。

有創造一些新單詞，比如prefaceate、driftift等

并且給它一個完整的解釋和定義。

甚至還有人整了個評測，去評估這個來路不明的大模型。結果在創意寫作測試中成績還不錯，排名第6，超過GPT-4、Claude3-Haiku等模型。

既然如此，這個非官方的大模型Llama3 120B又是怎么來的呢？

據作者介紹，它是用MergeKit制作，將Meta官方LIama3 70B模型合并（Self-Merge）

MergeKit咋是專門用來合并預訓練模型的工具包，合并可以完全在 CPU 上運行，也可以使用低至8GB的VRAM進行加速。在GitHub上已經收獲3.6k星。

目前支持Llama、Mistral、GPT-NeoX、StableLM 等模型。

△支持的合并算法

作者Maxime Labonne是一位資深機器學習專家，目前在一家通用大模型創業公司LiquidAI工作。

他博士畢業于巴黎理工學院，他在2019年開始研究大語言模型和圖神經網絡，并將他們應用到不同環境中，比如研發、工業、金融等，撰寫過書籍《Hands-On Graph Neural Networks using Python》。

他也是開發者社區的活躍開發者，在HuggingFace上發布過各種LLM，例如AlpahMonarch-7B、Beyonder-4x7B、Phixtral 和 NeuralBeagle14。以及一些工具，例如 LLM AutoEval、LazyMergekit、LazyZxolotl 和 AutoGGUF。

在GitHub上他的關于大模型課程，收獲29.5K Star。

不過對于這個「縫合」大模型的使用，作者建議可以用來創意寫作。

在多方評估中可以看到，它有時候會出現神經混亂，但寫作風格不錯。另外有時候還會出現拼寫錯誤，并且非常喜歡大寫字母。

而且由于覺得這個版本的推理能力比較差，于是作者再做了個225B的。

網友：看完更期待官方400B了

有網友猜測為什么LIama3-120B能這么強。

一方面，LIama3-70B自己確實很強，剛發布時就迅速躍居排行榜榜首。HuggingFace上顯示，上個月下載次數就超過了27萬次。

lmsysorg就深入分析了LIama3的實力，簡單來說，LIama3在開放式寫作和創意問題上擊敗了頂尖模型，但在封閉式數學和編碼問題上就稍弱一點。

不過隨著提示詞變得更加復雜，LIama3的能力也就下降得很明顯。

以及在輸出內容上面，LIama3的輸出比其他模型更友好，也更具對話性。

除此之外，也有網友分析這與模型深度有關。

事實上與LIama3-70B唯一的區別是額外的Layer，甚至是復制的，沒有新的訓練數據。。

這意味著，120B大模型的智能水平是從模型的深度產生的。“這不僅僅是訓練數據的函數，它是數據和深度的結合”。

有網友嘗試本地部署，Ollama上已經支持下載。網友表示：它使用48 GB VRAM + 38 GB 系統 RAM。

啊這……走了走了。

有提供GGUF形式的LMStudioAI，也很直接地說：不適合內存不足的人。

原作者也很逗趣地表示：是時候跟你的RAM做告別了。

但不管怎么說，已經在期待更多官方型號了。

比如，400B那種。

責任編輯：張燕妮來源：量子位

51CTO技術棧公眾號

業務
速覽

媒體

51CTO CIOAge HC3i

社區

51CTO博客鴻蒙開發者社區 AI.x社區

教育

51CTO學堂精培企業培訓 CTO訓練營

主站蜘蛛池模板：偷拍自拍网| 国产免费va | 中文字幕国产一区 | 国产精品久久久久久久久久久免费看 | 91人人爽 | 免费高清av | 亚洲xx在线| av免费看片 | 天天躁日日躁狠狠很躁 | 国产精品久久久久久久岛一牛影视 | 中文字幕av网站 | 精品国产视频 | 色综合久 | 美女在线观看av | 日韩av在线一区二区三区 | 综合激情久久 | h在线播放| 一区二区三区视频在线免费观看 | 亚洲一区 | 成人三区 | 我想看一级黄色毛片 | 美女久久 | 婷婷开心激情综合五月天 | 岛国毛片 | 成人3d动漫一区二区三区91 | 久久在线 | 亚洲国产高清高潮精品美女 | 在线国产一区 | 日本精品视频在线观看 | 久久成人午夜 | 久草在线 | 中文精品视频 | 精品久久久久国产免费第一页 | 2018天天干天天操 | 久久久亚洲成人 | 国产日韩欧美二区 | 久久久久国产一级毛片高清网站 | 日本中文字幕一区 | av网站在线看 | www.日日操 | 欧美一级毛片在线播放 |