成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

0門檻免費商用!孟子3-13B大模型正式開源,萬億token數據訓練

人工智能 新聞
據介紹,孟子3-13B大模型是基于Llama架構,數據集規模高達3T Tokens。

瀾舟科技官宣:孟子3-13B大模型正式開源!

這一主打高性價比的輕量化大模型,面向學術研究完全開放,并支持免費商用。

在MMLU、GSM8K、HUMAN-EVAL等各項基準測評估中,孟子3-13B都表現出了不錯的性能。

尤其在參數量20B以內的輕量化大模型領域,在中英文語言能力方面尤為突出,數學和編程能力也位于前列。

圖片
△以上結果基于5-shot。

據介紹,孟子3-13B大模型是基于Llama架構,數據集規模高達3T Tokens。

語料精選自網頁、百科、社交、媒體、新聞,以及高質量的開源數據集。通過在萬億tokens上進行多語言語料的繼續訓練,模型的中文能力突出并且兼顧多語言能力。

孟子3-13B大模型開源

只需兩步,就能使用孟子3-13B大模型了。

首先進行環境配置。

pip install -r requirements.txt

然后快速開始。

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained("Langboat/Mengzi3-13B-Base", use_fast=False, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("Langboat/Mengzi3-13B-Base", device_map="auto", trust_remote_code=True)
inputs = tokenizer('指令:回答以下問題。輸入:介紹一下孟子。輸出:', return_tensors='pt')
if torch.cuda.is_available():
    inputs = inputs.to('cuda')
pred = model.generate(**inputs, max_new_tokens=512, repetition_penalty=1.01, eos_token_id=tokenizer.eos_token_id)
print(tokenizer.decode(pred[0], skip_special_tokens=True))

此外,他們還提供了一個樣例代碼,可用于基礎模型進行單輪交互推理。

cd examples
python examples/base_streaming_gen.py --model model_path --tokenizer tokenizer_path

如果想要進行模型微調,他們也提供了相關文件和代碼。

圖片

事實上,早在3月18日的瀾舟大模型技術和產品發布會現場,就透露了孟子3-13B大模型的諸多細節。

當時他們表示,孟子3-13B大模型訓練已經完成。

對于選擇13B版本的原因,周明解釋道:

首先,瀾舟明確以服務ToB場景為主,ToC為輔。

實踐發現,ToB場景使用頻率最高的大模型參數量多為7B、13B、40B、100B,整體集中在10B-100B之間。

其次,在這個區間范圍內,從ROI(投資回報率)角度來講,既滿足場景需求,又最具性價比。

因此,在很長一段時間內,瀾舟的目標都是在10B-100B參數規模范圍內,打造優質的行業大模型。

作為國內最早一批大模型創業團隊,去年3月,瀾舟就發布了孟子GPT V1(MChat)。

今年1月,孟子大模型GPT V2(含孟子大模型-標準、孟子大模型-輕量、孟子大模型-金融、孟子大模型-編碼)對公眾開放。

好了,感興趣的朋友可戳下方鏈接體驗一下。

GitHub鏈接:https://github.com/Langboat/Mengzi3
HuggingFace:https://huggingface.co/Langboat/Mengzi3-13B-Base
ModelScope:https://www.modelscope.cn/models/langboat/Mengzi3-13B-Base
Wisemodel:https://wisemodel.cn/models/Langboat/Mengzi3-13B-Base

責任編輯:張燕妮 來源: 量子位
相關推薦

2023-10-31 10:11:50

昆侖萬維大模型

2023-10-30 14:59:28

2023-05-29 13:53:46

開源模型

2025-03-11 10:51:35

DifyDeepSeek大模型

2023-11-06 11:26:55

模型開源

2023-03-29 15:11:24

AI方案

2015-01-28 10:55:09

平安免費WiFi

2012-04-26 11:45:45

2018-07-23 16:18:01

2023-08-07 13:40:39

AI模型

2020-01-13 21:18:30

大咖來了大數據云分析平臺

2023-07-25 13:52:54

開源模型

2023-07-28 15:39:20

TransGPT人工智能開源

2023-07-18 15:05:00

開源大模型

2023-03-28 09:38:10

2023-08-03 19:11:45

2025-05-26 09:39:15

2023-06-25 13:31:44

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 毛片久久久| 日韩高清国产一区在线 | 中文字幕国产视频 | 久久1区 | 欧美中文字幕在线观看 | 久精品久久| 国产一区高清 | 日韩av免费看 | 国产精品久久久久久久久久久免费看 | 国产欧美一区二区三区在线看 | 国产精品美女久久久久久久网站 | 亚洲一区精品在线 | 五月婷婷色 | www.国产.com | 91电影在线播放 | 狠狠综合久久av一区二区小说 | 日韩国产在线观看 | 午夜免费观看体验区 | 精品一区二区三区在线观看 | 欧美精品一区二区三区在线 | 福利视频一区二区 | 亚洲成av人片在线观看 | 亚洲免费视频一区 | 亚洲最新网址 | 伊人一区 | 欧美日韩在线精品 | 91在线一区二区 | 1204国产成人精品视频 | 日韩欧美中文字幕在线观看 | 久久69精品久久久久久国产越南 | 精品久久香蕉国产线看观看亚洲 | 亚洲福利在线视频 | 午夜男人免费视频 | 91一区二区三区 | 午夜av成人 | 国产精品一区二区日韩 | 久久99深爱久久99精品 | 国产日韩精品在线 | 精品国产乱码久久久久久丨区2区 | a黄在线观看 | 亚洲一区视频在线 |