成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

將端側(cè)大模型進行到底-MiniCPM3-4B開源

發(fā)布于 2024-9-9 01:07
瀏覽
0收藏

面壁一直都在做端側(cè)大模型,之前有文本系列MiniCPM-2B模型,還有多模態(tài)系列的MiniCPM-V系列模型,今天又開源了MiniCPM3-4B模型,真是端側(cè)一路走到低。

這次MiniCPM3-4B也是在效果上有了巨大的提升,超過Phi-3.5-mini-Instruct模型,肩比Llama3.1-8B-Instruct、GLM-4-9B-Chat、Qwen2-7B-Instruct等一眾模型,堪稱小模型之王。

之前的MiniCPM-2B模型報告也是干活滿滿,詳見:https://shengdinghu.notion.site/MiniCPM-c805a17c5c8046398914e47f0542095a

這里說一下哈,MiniCPM-2B是1.0版本模型,MiniCPM-1B是2.0版本模型,現(xiàn)在是3.0版本4B。

模型改進

下面是3個版本的模型結(jié)構(gòu)(1->2->3)的區(qū)別:

  • 位置編碼:RoPE->RoPE->RoPE

注意力機制:MHA->GQA->MLA,MLA也是DeepSeek-V2的核心創(chuàng)新

將端側(cè)大模型進行到底-MiniCPM3-4B開源-AI.x社區(qū)

  • 詞表大?。?23K->73K->73K
  • 模型層數(shù):40->52->62
  • 隱藏層節(jié)點:2304->1536->2560
  • 最大長度:4k->4K->32k
  • 系統(tǒng)提示詞:不支持->不支持->支持
  • 工具調(diào)用和代碼解釋器:不支持->不支持->支持

同時,還發(fā)布了RAG套件MiniCPM-Embedding模型和MiniCPM-Reranker模型,針對 RAG場景還發(fā)布了微調(diào)版MiniCPM3-RAG-LoRA模型。

模型效果

MiniCPM3-4B模型在中文英文遵循、數(shù)據(jù)推理、代碼能力、工具調(diào)用上表現(xiàn)均很不錯的效果。

將端側(cè)大模型進行到底-MiniCPM3-4B開源-AI.x社區(qū)

其中,工具調(diào)用能力尤為突出,在Berkeley Function Calling Leaderboard上優(yōu)于Llama3.1-8B-Instruct、GLM-4-9B-Chat、Qwen2-7B-Instruct等更大模型。

將端側(cè)大模型進行到底-MiniCPM3-4B開源-AI.x社區(qū)

長文檔的大海撈針也是全綠。

將端側(cè)大模型進行到底-MiniCPM3-4B開源-AI.x社區(qū)

模型快速使用

PS:模型下載有困難的同學(xué),詳見我之前寫的一篇文章??《大模型下載使我痛苦》??。

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

# 模型加載
path = "openbmb/MiniCPM3-4B"

tokenizer = AutoTokenizer.from_pretrained(path, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(path, torch_dtype=torch.bfloat16, device_map="cuda", trust_remote_code=True)

# 輸入構(gòu)造
messages = [
    {"role": "user", "content": "你知道劉聰NLP是誰嗎?"},
]
model_inputs = tokenizer.apply_chat_template(messages, return_tensors="pt").to("cuda")

# 模型生成
model_outputs = model.generate(
    model_inputs,
    max_new_tokens=1024,
    top_p=0.8,
    temperature=0.9,
    repetition_penalty=1.1
)

# 模型解碼
output_token_ids = [
    model_outputs[i][len(model_inputs[i]):] for i in range(len(model_inputs))
]

responses = tokenizer.batch_decode(output_token_ids, skip_special_tokens=True)[0]
print(responses)

本文轉(zhuǎn)載自 ??NLP工作站??,作者: 劉聰NLP

收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
主站蜘蛛池模板: 99精品国产一区二区三区 | 一级在线观看 | 男女视频在线观看 | 久久国产精品免费一区二区三区 | 久久伊人操 | 久久一区二 | 亚洲网站在线 | 在线三级电影 | 99久久国产 | 中文字幕国产视频 | 国外成人在线视频 | 精品国产网 | 天天草天天爱 | 在线观看成年视频 | 欧美性一区二区三区 | 国产精品久久网 | 日本三级播放 | 欧美日韩国产一区二区三区 | 色啪网 | 亚av在线 | 国产精品久久 | 日韩日韩日韩日韩日韩日韩日韩 | 国产三级一区二区 | 久久国产亚洲 | 亚洲日本一区二区 | 成人午夜免费在线视频 | 狠狠的干狠狠的操 | 日韩中字幕| 欧美日韩亚洲国产 | 久久伊人免费视频 | 激情福利视频 | 亚洲瑟瑟 | 在线观看国产视频 | 亚洲人成在线观看 | 人人人人人爽 | 国产剧情一区二区三区 | 91久久精品国产 | 一区久久| 国产中文区二幕区2012 | 午夜精品影院 | 亚洲另类春色偷拍在线观看 |