成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<abbr id="a88ei"></abbr>

<samp id="a88ei"><option id="a88ei"></option></samp>

<center id="a88ei"><xmp id="a88ei"></xmp></center>

<li id="a88ei"><noframes id="a88ei"></noframes></li>

<noscript id="a88ei"></noscript>

<samp id="a88ei"><tr id="a88ei"></tr></samp>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

一大堆Chinese Llama3正在襲來

發布于 2024-7-4 09:02

瀏覽

0收藏

寫在前面

大家好，我是劉聰NLP。

Llama3模型已經開源，可以就在這短短的兩天之內，就出現了很多Chinese-Llama3 repo，開源社區也是相當的卷。

再看到Llama3相關報告的時候，就預料到會有很多Chinese-Llama3，因為Llama3對中文十分不友好，15T Tokens的訓練數據，僅有5%（750B Tokens）是其他語言，那么中文就更少了。

一大堆Chinese Llama3正在襲來-AI.x社區

當時還抖激靈，說先開個repo占個坑（其實是想做但沒卡）

很多網友們測試，也發現Llama3能力很強，可以理解中文問題的意思，但輸出內容就會是英文，在提示詞中強調用中文的情況下，會使用中文回答，但不穩定，有時會出現中英文結合的情況。

一大堆Chinese Llama3正在襲來-AI.x社區

中文問題

一大堆Chinese Llama3正在襲來-AI.x社區

強調中文回答

一大堆Chinese Llama3正在襲來-AI.x社區

強調中文回答-但輸出英文

一大堆Chinese Llama3正在襲來-AI.x社區

強調中文回答-但輸出英文

可想而知，開源社區會對Llama3進行中文增強（畢竟llama3基座很強），當然還是那幾步：擴充中文詞表、中文數據continue-pretrain、中文sft。

當然就像Llama2出來的時候一樣，會帶來很多機遇，借助Llama3的名頭，還是可以肝出不少內容的。

下面先簡單對Llama3進行介紹，再給大家分享一些已經開源的Chinese-Llama3項目。

Llama3

Llama3模型目前共開源了8B和70B兩個參數規模的模型，400B參數規模的模型還在訓練中。MetaAI也表示接下來的幾個月里，將發布多個具有新功能的模型，包括多模態、多語言對話能力、更長的上下文窗口以及更強的綜合能力的模型。

Blog: https://ai.meta.com/blog/meta-llama-3
HF: https://huggingface.co/meta-llama/Meta-Llama-3-70B

結構與Llama2基本一致，詞表大小擴充到128K，8B和70B大小的模型中都采用了分組查詢注意力（GQA），最大長度8K。
15T Tokens進行模型預訓練，整體是Llama2的7倍，代碼數據是Llama2的4倍，其中5%的數據由其他30種語言組成。
訓練優化（數據并行、模型并行和流水線并行）實現同時在16K個GPU上訓練，每個GPU的計算利用率超過400 TFLOPS。最終在24K個GPU上訓練，相比于Llama2訓練效率提高了約三倍。

一大堆Chinese Llama3正在襲來-AI.x社區

llmsys對戰

暫時投票還有點少，但匿名PK榜單效果已經很逆天了，暫時成為開源之最。

Chinese-Llama3

下面放幾個已經開源權重的Chinese-Llama3，這才兩天，后面會越來越多，現在還有一些repo在占坑。

一大堆Chinese Llama3正在襲來-AI.x社區

CrazyBoyM/llama3-Chinese-chat

Github: https://github.com/CrazyBoyM/llama3-Chinese-chat

大佬們真實太肝了，目前涉及的版本是base和instruct模型利用中文數據直接SFT。

2024-04-19 下午1點：世界上首個llama3 中文版訓練完成，晚上沒睡覺哈哈，使用170k+高質量多輪中文對話數據連夜訓練得到。
2024-04-20 早上7點：v2版訓練完成。
2023-04-20 晚上23點：instruct 中文版訓練完成。

數據集主要涉及firefly-train-1.1M、shareAI/CodeChat、shareAI/ShareGPT-Chinese-English-90k、ruozhiba、COIG-CQIA和自己造的數據。

UnicomAI/Unichat-llama3-Chinese

Github: https://github.com/UnicomAI/Unichat-llama3-Chinese

中國聯通AI創新中心開源，目前版本應該也是直接SFT版本，暫不清楚是基于base模型還是instruct模型。說后續會更新64K版本、增量預訓練版本。

數據量未知，但表明是高質量指令數據（覆蓋多個領域和行業），微調指令數據經過嚴格的人工篩查（如果真人工，是個大工程）。

BoyangZ/llama3-chinese

HF: https://huggingface.co/BoyangZ/llama3-chinese

僅通過silk-road/Wizard-LM-Chinese-instruct-evol數據訓練2個epoch進行中文測試。其中，maxlenght=2k、bs=8、steps=500。

寫在最后

開源社區真的太卷了，上面兩個項目都號稱首個Chinese-Llama3，但暫時開源的還是Chinese-Llama3-8B為主，也可以理解，畢竟8B訓練的更快。

期待后面更多的Chinese-Llama3出來，相信不久ymcui、lily、firefly、 IDEA等都會開中文Llama3吧。

本文轉載自 ??NLP工作站??，作者：劉聰NLP

標簽

贊

收藏

回復

舉報

回復

相關推薦

Meta 發布Llama 3，能力直逼GPT-4,一己之力拉高開源大模型水位

51CTO技術棧 ? 4394瀏覽 ? 0回復
低比特量化的LLAMA3模型有多好？ | 香港大學&北航最新研究發布

angel ? 6804瀏覽 ? 0回復
大模型競技場全面測評結果出爐：Llama3 70B成開源模型中最強王者！

AIGC最前線 ? 6164瀏覽 ? 0回復
Llama3背后的秘密：HuggingFace發布萬億級數據集Fineweb

AIGC最前線 ? 1.2w瀏覽 ? 0回復
僅需Llama3 1/17的訓練成本，Snowflake開源128x3B MoE模型

輕薄滴假象 ? 2940瀏覽 ? 0回復
LangChain v0.2：向穩定性邁進的一大步

ermulong ? 4024瀏覽 ? 0回復
僅靠開源數據復刻出LLaMA3指令學習效果，在線迭代RLHF全流程解決方案來了

輕薄滴假象 ? 2912瀏覽 ? 0回復
從零復現Llama3代碼庫爆火，大神Kapathy一鍵三連，GitHub狂攬2k+

Crystalcxt ? 2624瀏覽 ? 0回復
Llama3實操增強的三種方式：RAG/Agent/Function Calling?。?！

玄姐聊AGI ? 5731瀏覽 ? 0回復
Meta LlaMA 3模型深度解析

51CTO內容精選 ? 4445瀏覽 ? 0回復
32專家MoE大模型免費商用！性能全面對標Llama3，單token推理消耗僅5.28%

Crystalcxt ? 2912瀏覽 ? 0回復
本地使用Groq Llama 3 70B的逐步指南

51CTO內容精選 ? 3669瀏覽 ? 0回復
Llama-2 vs. Llama-3：利用微型基準測試（井字游戲）評估大模型

Baihai_IDP ? 3013瀏覽 ? 0回復
性能超Llama 3，可商用！開源大模型Falcon 2

Aceryt ? 3413瀏覽 ? 0回復
一大堆Llama3.1-Chinese正在襲來

NLP工作站 ? 3202瀏覽 ? 0回復
基于Llama3，為本地文件創建生成式AI搜索引擎

小虎哦哦 ? 2766瀏覽 ? 0回復
LLaMA 3 背后的大規模 GPU 集群 RoCE 網絡建設

amei2000go ? 4902瀏覽 ? 0回復
機器學習 | 從0開發大模型-譯llama3-from-scratch

周末程序猿 ? 2116瀏覽 ? 0回復
谷歌的“雙子星”，正在圍剿一眾大模型

51CTO技術棧 ? 1408瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

TransDiff--最簡潔的AR Transformer + Diffusion圖像生成方法 1天前發布
遲來！解讀Qwen開源的Embedding模型中的細節！附實測結果！ 2025-06-13 07:17:37發布

熱門推薦

AI Agents開源工具棧全解析~ 1回復

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當，實測來了 0回復

上一篇：數據合成方法-讓模型自己說出用了哪些指令對齊數據

下一篇： RegMix-用回歸任務解決大模型數據混合問題

社區精華內容

目錄

主站蜘蛛池模板：国产精品一区二区三区免费观看 | 久久精品国产亚洲一区二区三区 | 另类专区亚洲 | 久久精品国产亚洲一区二区三区 | 成人精品视频免费 | 日韩精品一区二区三区在线播放 | 国产精品视频在线观看 | 欧美日批| 涩涩视频在线观看 | 国产精品久久av | 国产一级片在线观看视频 | 久久九七 | 国产一区亚洲 | 福利网址| 91久久久久久久久久久久久 | 欧美日韩在线看 | 欧美一区二区三区高清视频 | 日韩精品一区二区三区视频播放 | 国产一级在线 | 毛片99| 久久免费视频网 | 精品一区二区久久久久久久网精 | 在线免费观看黄a | 草草精品 | а_天堂中文最新版地址 | 久久久久亚洲精品中文字幕 | 黄色激情毛片 | 婷婷桃色网 | 日韩毛片免费视频 | 日韩成人影院 | 久久亚洲一区二区 | 久久久久网站 | 亚洲欧洲在线视频 | 九九久久国产 | 中文字幕在线精品 | 国产在线精品一区二区三区 | www.9191.com | 欧美成视频 | www.精品国产 | 国产精品一区二区在线 | 久久99精品久久久久婷婷 |

<source id="fnyfx"><dfn id="fnyfx"></dfn></source>

<li id="fnyfx"><menu id="fnyfx"></menu></li>

<s id="fnyfx"><tbody id="fnyfx"></tbody></s>