成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<abbr id="yacoo"></abbr>

<li id="yacoo"><dl id="yacoo"></dl></li>

<button id="yacoo"><input id="yacoo"></input></button>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

一大堆Llama3.1-Chinese正在襲來精華

發布于 2024-8-1 14:19

瀏覽

0收藏

寫在前面

Llama3.1模型已經開源，在這短短幾天之內，也是出現了一些Llama3.1漢化的repo，開源社區也是相當的卷。

主要是Llama3.1沒有關注中文，雖然是多語言，但主要針對英語、法語、德語、印地語、意大利語、葡萄牙語、西班牙語和泰語。

雖然讓Llama3.1系列模型用中文回答時，也可以正常回答，但仍然有中英文混合現象，并且詞表是真沒中文呀，中文場景下解碼效率會比較低。

咋說呢？反正也給中文大模型更多機會吧，開源社區也有更多事情可以做。

對Llama3.1進行中文增強，當然還是那幾步：擴充中文詞表、中文數據continue-pretrain、中文sft。

下面先簡單過一下Llama3.1的一些介紹和效果，再給大家分享一些已經開源的Chinese-Llama3.1項目。

Llama3.1介紹和效果

前幾天關于Llama3.1的介紹其實一大堆了，我就不過的介紹了，可以看我之前分享的兩篇文章Llama3.1系列模型正式開源，最大405B，閉源模型的統治時代將迎來結束？和淺談Llama3.1，從結構、訓練過程、影響到數據合成。

對于Llama3.1的系列模型，現在很多平臺都已經支持，如果本地沒有資源部署，可以從這些平臺上測試。下面的測試截圖均來自Hugging Chat測試結果。

HF：https://huggingface.co/chat/

雖然Llama3.1-405B模型榜單效果有很秀，但是9.9和9.11誰的大也是一本正經的的胡說八道。

一大堆Llama3.1-Chinese正在襲來-AI.x社區

不過確實是Tokenizer的問題。

一大堆Llama3.1-Chinese正在襲來-AI.x社區

其實對于個人來說比較奇怪，之前一些模型其實都強調過，數字內容按照每個單獨數字切割，不知道為啥Llama3.1沒有采用該策略。

反正GPT4也是一樣。

一大堆Llama3.1-Chinese正在襲來-AI.x社區

下面兩個弱智吧的問題，考考Llama3.1（405B）,

石油也是油，為啥沒人用它來炒菜？

一大堆Llama3.1-Chinese正在襲來-AI.x社區

如果把臟話都說出來了，那么嘴是不是就干凈了

一大堆Llama3.1-Chinese正在襲來-AI.x社區

為什么孫悟空是中國猴子卻叫美猴王，不應該叫中猴王嗎？

一大堆Llama3.1-Chinese正在襲來-AI.x社區

下雨天關節疼那我騙它是晴天不就不會疼了。

一大堆Llama3.1-Chinese正在襲來-AI.x社區

整體來說，還是比較不錯的，可以理解其中的含義，不過如果不強調中文回答，總是出現中英混雜的情況。

個人覺得，如果是公開、簡單的中文任務，Llama3.1還是可以直接使用的，但如果是比較領域、具化的場景，可能效果不會很好。

本人在自己的一個中文分類場景上，比較過Qwen2-7B、ChatGLM3-6B和Llama3.1-8B的效果，無論是否SFT，Llama3.1-8B在中文上的效果都要比另外兩個差。

PS：個人數據結果，不是絕對，可以自行嘗試，同時也歡迎留言討論。

Chinese-Llama3.1模型

下面放幾個已經開源權重的Chinese-Llama3.1，這才兩天，后面會越來越多，現在還有一些repo在占坑。

shenzhi-wang/Llama3.1-8B-Chinese-Chat
shenzhi-wang/Llama3.1-70B-Chinese-Chat
haijian06/Llama3.1-Chinese-Chat
shareAI/llama3.1-8b-instruct-dpo-zh

但現在還是已SFT為主，在等等會有更多Chinese-Llama3.1系列模型出現，畢竟之前Chinese-Llama3已經有很多模型啦。

騙Star的機會又來啦！！！

寫在最后

Llama3.1系列模型的開源意義真是蠻大的，405B證明開源也能追該上閉源，雖然Mistral新開源的123B模型狙擊了Llama3.1-405B，但只能說開源真實原來越好了。

但是從真實使用角度來說，還是8B、70B的模型作用更直接，畢竟很多大模型真正落地上線的規模也就8B，要不然并發起來真耗不起。

那么有一個不成熟的想法，是否更大的開源模型利于哪些搞大模型AI平臺的廠商，因為自己有一套infra優化機制，專注推理，又有卡，為更多企業提供服務。而小模型才是企業可以自己玩耍的，服務器不用推太多，開源推理框架就夠用了。

最后，小扎的格局要打開呀，Mistral-123B都支持中文呦！

本文轉載自 ??NLP工作站??，作者：劉聰NLP

標簽

贊

收藏

回復

舉報

回復

相關推薦

LangChain v0.2：向穩定性邁進的一大步

ermulong ? 4021瀏覽 ? 0回復
一大堆Chinese Llama3正在襲來

NLP工作站 ? 2797瀏覽 ? 0回復
Llama 3.1磁力鏈提前泄露！開源模型王座一夜易主，GPT-4o被超越

duhorse ? 2320瀏覽 ? 0回復
最強模型Llama 3.1 405B正式發布，扎克伯格：開源引領新時代

輕薄滴假象 ? 2517瀏覽 ? 0回復
最強大模型 Llama 3.1-405B 架構設計剖析

玄姐聊AGI ? 3341瀏覽 ? 0回復
解析Llama 3.1 與Meta 的 AI 戰略，以及新的開放前沿模型生態系統

lintoms ? 2672瀏覽 ? 0回復
基于Llama 3.1和一臺MacBook搭建商用級知識庫

玄姐聊AGI ? 3125瀏覽 ? 0回復
AI界的新寵：揭秘Llama 3.1如何革新AI合成技術

ermulong ? 2513瀏覽 ? 0回復
微軟開源Phi-3.5：支持手機、平板電腦，性能超Llama 3.1

Aceryt ? 2471瀏覽 ? 0回復
ViT篇外：NVIDIA Llama-3.1-Minitron 4B

魯班模錘1 ? 2675瀏覽 ? 0回復
阿里史上最大規模開源發布，超GPT-4o 、Llama-3.1！

Aceryt ? 2442瀏覽 ? 0回復
Llama 3.1 405B，教你白嫖使用最強開源大模型

小虎哦哦 ? 2950瀏覽 ? 0回復
從 Llama 1 到 3.1：Llama 模型架構演進詳解

Baihai_IDP ? 4691瀏覽 ? 0回復
Llama 3.1 70B AQLM-PV版發布！大模型壓縮后可在24GB顯存GPU上本地運行！！

老蛀蟲 ? 2862瀏覽 ? 0回復
使用LLaMA 3.1、Firebase和Node.js，構建一個音控的智能廚房應用程序

51CTO內容精選 ? 2253瀏覽 ? 0回復
Dolphin 3.0 發布（Llama 3.1 + 3.2 + Qwen 2.5）：本地優先、可操縱的 AI 模型

Halo咯咯 ? 2626瀏覽 ? 0回復
Good Fire AI 針對 Llama 3.1 8B 和 Llama 3.3 70B 的開源稀疏自動編碼器 (SAE)

Halo咯咯 ? 2077瀏覽 ? 0回復
NVIDIA開源Llama-3.1-Nemotron-Ultra-253B-v1，性能直逼DeepSeek

Halo咯咯 ? 1620瀏覽 ? 0回復
谷歌的“雙子星”，正在圍剿一眾大模型

51CTO技術棧 ? 1408瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

TransDiff--最簡潔的AR Transformer + Diffusion圖像生成方法 1天前發布
遲來！解讀Qwen開源的Embedding模型中的細節！附實測結果！ 2025-06-13 07:17:37發布

熱門推薦

AI Agents開源工具棧全解析~ 1回復

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當，實測來了 0回復

上一篇： Llama3.1系列模型正式開源，最大405B，閉源模型的統治時代將迎來結束？

下一篇：淺談—領域模型訓練

社區精華內容

目錄

主站蜘蛛池模板：天天干天天玩天天操 | 九九热精品免费 | 日韩精品1区2区3区成人黄页在线观看 | 欧美一区二区三区在线视频 | 国产成人精品一区二区三区四区 | 国产精品久久久久久吹潮 | 一区二区久久 | 日韩第一区 | 99国产精品久久久久久久 | 一级片免费观看 | 久久久久久免费看 | 波多野结衣先锋影音 | 国产视频久 | 色一情一乱一伦一区二区三区 | 久久精品二区 | 亚洲精品91| 成人不卡| 国产精品99久久久久久久久 | 精品人伦一区二区三区蜜桃网站 | 精品av天堂毛片久久久借种 | 久久久久久久国产精品 | 久久天堂网 | 中文字幕一区二区三区四区五区 | 91在线网| 视频一区二区在线观看 | 成人小视频在线观看 | 日韩不卡在线 | 精品国产乱码久久久久久1区2区 | 成年人黄色小视频 | 国产精品视频一区二区三区 | 成年人的视频免费观看 | 成人精品久久 | 欧美国产日韩一区二区三区 | 久久国产日本 | 免费久久久 | 国产黄色网 | h视频在线免费观看 | 国产精品不卡一区二区三区 | 男人的天堂视频网站 | 91国产在线视频在线 | aa级毛片毛片免费观看久 |

<button id="smqaa"></button>

<rt id="smqaa"></rt>