Qwen3震撼發(fā)布，問(wèn)鼎開(kāi)源寶座，教你快速上手精華

發(fā)布于 2025-5-7 07:03

瀏覽

0收藏

通義千問(wèn)3（Qwen3），通義千問(wèn)大語(yǔ)言模型家族的最新成員。作為阿里巴巴的旗艦?zāi)Ｐ停x千問(wèn)3-235B-A22B在編碼、數(shù)學(xué)、通用能力等基準(zhǔn)評(píng)估中，與DeepSeek-R1、o1、o3-mini、Grok-3、Gemini-2.5-Pro等其他頂級(jí)模型相比，取得了極具競(jìng)爭(zhēng)力的成績(jī)。此外，小型混合專家（MoE）模型通義千問(wèn)3-30B-A3B，其激活參數(shù)僅為QwQ-32B的十分之一，卻超越了后者的表現(xiàn)；甚至像通義千問(wèn)3-4B這樣的微型模型，也能與通義千問(wèn)2.5-72B-Instruct相媲美。

通義千問(wèn) 3 成績(jī)斐然，其諸多特性為人工智能領(lǐng)域注入了新活力。下面，本文帶你深入了解這款模型的具體情況。

1.簡(jiǎn)介

通義千問(wèn)（Qwen）是阿里巴巴集團(tuán)通義千問(wèn)團(tuán)隊(duì)研發(fā)的大語(yǔ)言模型和大多模態(tài)模型系列。語(yǔ)言模型和多模態(tài)模型均在大規(guī)模多語(yǔ)言和多模態(tài)數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練，并在高質(zhì)量數(shù)據(jù)上進(jìn)行微調(diào)以匹配人類偏好。通義千問(wèn)具備自然語(yǔ)言理解、文本生成、視覺(jué)理解、音頻理解、工具使用、角色扮演、充當(dāng)人工智能智能體等能力。

最新版本的通義千問(wèn)3具有以下特點(diǎn)：

密集型和混合專家模型：提供0.6B、1.7B、4B、8B、14B、32B，以及30B-A3B、235B-A22B等不同規(guī)模的模型。
思維模式無(wú)縫切換：?jiǎn)蝹€(gè)模型可在思維模式（用于復(fù)雜邏輯推理、數(shù)學(xué)計(jì)算和編碼任務(wù)）和非思維模式（用于高效通用聊天）之間無(wú)縫切換，確保在各種場(chǎng)景下都能實(shí)現(xiàn)最佳性能。
推理能力顯著提升：推理能力大幅增強(qiáng)，在數(shù)學(xué)運(yùn)算、代碼生成和常識(shí)邏輯推理方面，超越了之前的QwQ模型（在思維模式下）和通義千問(wèn)2.5指令模型（在非思維模式下）。
高度契合人類偏好：在創(chuàng)意寫作、角色扮演、多輪對(duì)話和指令遵循方面表現(xiàn)卓越，提供更自然、引人入勝和沉浸式的對(duì)話體驗(yàn)。
強(qiáng)大的智能體能力：在思維和非思維模式下都能精準(zhǔn)集成外部工具，在復(fù)雜的基于智能體的任務(wù)中，開(kāi)源模型里性能領(lǐng)先。
多語(yǔ)言支持廣泛：支持100多種語(yǔ)言和方言，具備強(qiáng)大的多語(yǔ)言指令遵循和翻譯能力。

Qwen3震撼發(fā)布，問(wèn)鼎開(kāi)源寶座，教你快速上手-AI.x社區(qū)

阿里巴巴開(kāi)源了兩款混合專家模型：通義千問(wèn)3-235B-A22B，這款大型模型總參數(shù)達(dá)2350億，激活參數(shù)為220億；以及通義千問(wèn)3-30B-A3B，小型混合專家模型，總參數(shù)300億，激活參數(shù)30億。此外，還開(kāi)源了六款密集型模型，包括通義千問(wèn)3-32B、通義千問(wèn)3-14B、通義千問(wèn)3-8B、通義千問(wèn)3-4B、通義千問(wèn)3-1.7B和通義千問(wèn)3-0.6B，均遵循Apache 2.0許可協(xié)議。

Qwen3震撼發(fā)布，問(wèn)鼎開(kāi)源寶座，教你快速上手-AI.x社區(qū)

像通義千問(wèn)3-30B-A3B這樣的微調(diào)模型，以及其預(yù)訓(xùn)練版本（如通義千問(wèn)3-30B-A3B-Base），現(xiàn)已在Hugging Face、魔搭社區(qū)（ModelScope）和Kaggle等平臺(tái)上線。部署時(shí)，建議使用SGLang和vLLM等框架。對(duì)于本地使用，強(qiáng)烈推薦Ollama、LMStudio、MLX、llama.cpp和KTransformers等工具。這些選擇能確保用戶在研究、開(kāi)發(fā)或生產(chǎn)環(huán)境中，輕松將通義千問(wèn)3集成到工作流程中。

通義千問(wèn)3的發(fā)布和開(kāi)源，將極大推動(dòng)大型基礎(chǔ)模型的研發(fā)進(jìn)程。通義千問(wèn)3旨在賦能全球研究人員、開(kāi)發(fā)者和組織機(jī)構(gòu)，助力他們利用這些前沿模型構(gòu)建創(chuàng)新解決方案。

2.主要特性

2.1 混合思維模式

通義千問(wèn)3系列模型引入了一種混合式問(wèn)題解決方法，支持兩種模式：

思維模式：在這種模式下，模型會(huì)逐步推理，經(jīng)過(guò)深思熟慮后給出最終答案。這種模式非常適合處理需要深入思考的復(fù)雜問(wèn)題。
非思維模式：模型會(huì)快速給出近乎即時(shí)的響應(yīng)，適用于對(duì)速度要求高于深度的簡(jiǎn)單問(wèn)題。

這種靈活性使用戶能夠根據(jù)手頭任務(wù)，控制模型的“思考”程度。比如，對(duì)于較難的問(wèn)題，可以讓模型進(jìn)行深入推理；而對(duì)于簡(jiǎn)單問(wèn)題，則能快速直接作答。兩種模式的融合，顯著增強(qiáng)了模型實(shí)施穩(wěn)定且高效的思維預(yù)算控制能力。如上文所示，通義千問(wèn)3的性能提升具有可擴(kuò)展性且平穩(wěn)，與分配的計(jì)算推理預(yù)算直接相關(guān)。這種設(shè)計(jì)讓用戶能更輕松地為特定任務(wù)配置預(yù)算，在成本效益和推理質(zhì)量之間實(shí)現(xiàn)更優(yōu)平衡。

Qwen3震撼發(fā)布，問(wèn)鼎開(kāi)源寶座，教你快速上手-AI.x社區(qū)

2.2 多語(yǔ)言支持

通義千問(wèn)3系列模型支持119種語(yǔ)言和方言。這種廣泛的多語(yǔ)言能力為國(guó)際應(yīng)用開(kāi)辟了新的可能性，讓全球用戶都能受益于這些模型的強(qiáng)大功能。

Qwen3震撼發(fā)布，問(wèn)鼎開(kāi)源寶座，教你快速上手-AI.x社區(qū)

2.3 增強(qiáng)的智能體能力

阿里巴巴針對(duì)編碼和智能體能力對(duì)通義千問(wèn)3系列模型進(jìn)行了優(yōu)化，同時(shí)也加強(qiáng)了對(duì)模型上下文協(xié)議（MCP）的支持。以下示例展示了通義千問(wèn)3如何思考以及與環(huán)境交互。

3.預(yù)訓(xùn)練

在預(yù)訓(xùn)練方面，通義千問(wèn)3的數(shù)據(jù)集相比通義千問(wèn)2.5有了顯著擴(kuò)展。通義千問(wèn)2.5在18萬(wàn)億個(gè)詞元上進(jìn)行預(yù)訓(xùn)練，而通義千問(wèn)3使用了近兩倍的數(shù)據(jù)量，約36萬(wàn)億個(gè)詞元，涵蓋119種語(yǔ)言和方言。為構(gòu)建這個(gè)大型數(shù)據(jù)集，數(shù)據(jù)來(lái)源不僅包括網(wǎng)頁(yè)，還包括類似PDF的文檔。阿里巴巴利用通義千問(wèn)2.5-VL從這些文檔中提取文本，并借助通義千問(wèn)2.5提高提取內(nèi)容的質(zhì)量。為增加數(shù)學(xué)和代碼數(shù)據(jù)量，使用通義千問(wèn)2.5-Math和通義千問(wèn)2.5-Coder生成合成數(shù)據(jù)，包括教科書內(nèi)容、問(wèn)答對(duì)和代碼片段。

預(yù)訓(xùn)練過(guò)程分為三個(gè)階段。在第一階段（S1），模型在超過(guò)30萬(wàn)億個(gè)詞元上進(jìn)行預(yù)訓(xùn)練，上下文長(zhǎng)度為4000詞元。這一階段賦予模型基本的語(yǔ)言技能和通用知識(shí)。在第二階段（S2），通過(guò)增加知識(shí)密集型數(shù)據(jù)（如STEM領(lǐng)域、編碼和推理任務(wù)相關(guān)數(shù)據(jù)）的比例來(lái)優(yōu)化數(shù)據(jù)集，然后模型在額外的5萬(wàn)億個(gè)詞元上進(jìn)行預(yù)訓(xùn)練。在最后階段，使用高質(zhì)量的長(zhǎng)上下文數(shù)據(jù)將上下文長(zhǎng)度擴(kuò)展到32000詞元，確保模型能有效處理更長(zhǎng)的輸入。

Qwen3震撼發(fā)布，問(wèn)鼎開(kāi)源寶座，教你快速上手-AI.x社區(qū)

由于模型架構(gòu)的進(jìn)步、訓(xùn)練數(shù)據(jù)量的增加以及更有效的訓(xùn)練方法，通義千問(wèn)3（Qwen3）的密集型基礎(chǔ)模型的整體性能與參數(shù)更多的通義千問(wèn)2.5基礎(chǔ)模型相當(dāng)。例如，通義千問(wèn)3-1.7B/4B/8B/14B/32B基礎(chǔ)模型的表現(xiàn)分別與通義千問(wèn)2.5-3B/7B/14B/32B/72B基礎(chǔ)模型不相上下。值得注意的是，在STEM（科學(xué)、技術(shù)、工程和數(shù)學(xué)）領(lǐng)域、編碼和推理等方面，通義千問(wèn)3的密集型基礎(chǔ)模型甚至超越了參數(shù)更多的通義千問(wèn)2.5模型。對(duì)于通義千問(wèn)3的混合專家（MoE）基礎(chǔ)模型而言，它們僅使用了通義千問(wèn)2.5密集型基礎(chǔ)模型10%的激活參數(shù)，卻實(shí)現(xiàn)了相近的性能，這大大節(jié)省了訓(xùn)練和推理成本。

4.微調(diào)訓(xùn)練

Qwen3震撼發(fā)布，問(wèn)鼎開(kāi)源寶座，教你快速上手-AI.x社區(qū)

為了開(kāi)發(fā)出既能進(jìn)行逐步推理又能快速響應(yīng)的混合模型，采用了四階段訓(xùn)練流程。該流程包括：（1）長(zhǎng)思維鏈（CoT）冷啟動(dòng)；（2）基于推理的強(qiáng)化學(xué)習(xí)（RL）；（3）思維模式融合；（4）通用強(qiáng)化學(xué)習(xí)。

在第一階段，使用多樣化的長(zhǎng)思維鏈數(shù)據(jù)對(duì)模型進(jìn)行微調(diào)，這些數(shù)據(jù)涵蓋數(shù)學(xué)、編碼、邏輯推理和STEM問(wèn)題等各種任務(wù)和領(lǐng)域，目的是賦予模型基本的推理能力。第二階段聚焦于為強(qiáng)化學(xué)習(xí)擴(kuò)展計(jì)算資源，利用基于規(guī)則的獎(jiǎng)勵(lì)機(jī)制來(lái)提升模型的探索和利用能力。

在第三階段，通過(guò)在長(zhǎng)思維鏈數(shù)據(jù)和常用的指令微調(diào)數(shù)據(jù)的組合上進(jìn)行微調(diào)，將非思維能力集成到思維模型中。這些數(shù)據(jù)由第二階段增強(qiáng)后的思維模型生成，確保了推理能力和快速響應(yīng)能力的無(wú)縫融合。最后，在第四階段，針對(duì)20多個(gè)通用領(lǐng)域的任務(wù)應(yīng)用強(qiáng)化學(xué)習(xí)，進(jìn)一步強(qiáng)化模型的通用能力并糾正不良行為。這些任務(wù)包括指令遵循、格式遵循和智能體能力等。

5.快速上手

在Hugging Face Hub的通義千問(wèn)3集合以及魔搭社區(qū)（ModelScope）的通義千問(wèn)3集合中，都能找到通義千問(wèn)3系列模型。

5.1 Transformers

若要快速上手通義千問(wèn)3，可以先嘗試使用Transformers進(jìn)行推理。確保已安裝??transformers>=4.51.0??，建議使用Python 3.10及以上版本，PyTorch 2.6及以上版本。

以下是運(yùn)行通義千問(wèn)3-8B的簡(jiǎn)單代碼示例：

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "Qwen/Qwen3-8B"
# 加載分詞器和模型
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype="auto",
    device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(model_name)
# 準(zhǔn)備模型輸入
prompt = "Give me a short introduction to large language models."
messages = [
    {"role": "user", "content": prompt},
]
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True,
    enable_thinking=True, # 在思維模式和非思維模式間切換。默認(rèn)值為True。
)
model_inputs = tokenizer([text], return_tensors="pt").to(model.device)
# 進(jìn)行文本生成
generated_ids = model.generate(
    **model_inputs,
    max_new_tokens=32768
)
output_ids = generated_ids[0][len(model_inputs.input_ids[0]):].tolist()  # 解析思維內(nèi)容
try:
    # rindex查找151668（</think>）
    index = len(output_ids) - output_ids[::-1].index(151668)
except ValueError:
    index = 0
thinking_content = tokenizer.decode(output_ids[:index], skip_special_tokens=True).strip("\n")
content = tokenizer.decode(output_ids[index:], skip_special_tokens=True).strip("\n")
print("thinking content:", thinking_content)
print("content:", content)

通義千問(wèn)3和QwQ系列模型類似，在回復(fù)前會(huì)進(jìn)行思考。這意味著模型會(huì)運(yùn)用推理能力來(lái)提高生成回復(fù)的質(zhì)量。模型會(huì)先生成包裹在??<think>...</think>??標(biāo)簽中的思考內(nèi)容，然后給出最終回復(fù)。

硬切換：若要嚴(yán)格禁用模型的思考行為，使其功能與之前的通義千問(wèn)2.5指令模型一致，可以在格式化文本時(shí)將??enable_thinking??設(shè)置為??False??。

text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True,
    enable_thinking=False  # 設(shè)置enable_thinking=False可禁用思維模式
)

在某些對(duì)效率要求極高、禁用思考至關(guān)重要的場(chǎng)景中，這種設(shè)置尤為有用。

軟切換：通義千問(wèn)3還能理解用戶對(duì)其思考行為的指令，特別是軟切換指令??/think??和??/no_think??。可以將它們添加到用戶提示或系統(tǒng)消息中，在不同輪次的對(duì)話中切換模型的思維模式。在多輪對(duì)話中，模型會(huì)遵循最新的指令。

注意：在思維模式下，使用溫度（Temperature）=0.6、核采樣概率（TopP）=0.95、采樣數(shù)量（TopK）=20、最小概率（MinP）=0（這是??generation_config.json??中的默認(rèn)設(shè)置）。不要使用貪婪解碼，因?yàn)檫@可能會(huì)導(dǎo)致性能下降和內(nèi)容重復(fù)。更多詳細(xì)指導(dǎo)，請(qǐng)參考最佳實(shí)踐部分。

在非思維模式下，建議使用溫度（Temperature）=0.7、核采樣概率（TopP）=0.8、采樣數(shù)量（TopK）=20、最小概率（MinP）=0。

5.2 魔搭社區(qū)（ModelScope）

若要解決下載相關(guān)的問(wèn)題，建議嘗試使用魔搭社區(qū)（ModelScope）。在開(kāi)始前，需要使用??pip???安裝??modelscope??。

魔搭社區(qū)（ModelScope）采用了與Transformers類似（但不完全相同）的編程接口。在基本用法中，只需將上述代碼的第一行修改如下：

from modelscope import AutoModelForCausalLM, AutoTokenizer

5.3 vLLM

若要部署通義千問(wèn)3，建議使用vLLM。vLLM是一個(gè)快速且易于使用的大語(yǔ)言模型推理和服務(wù)框架。下面展示如何使用vLLM構(gòu)建一個(gè)與OpenAI API兼容的API服務(wù)。

首先，確保已安裝??vllm>=0.8.5??。

以通義千問(wèn)3-8B為例，運(yùn)行以下代碼來(lái)構(gòu)建vLLM服務(wù)：

vllm serve Qwen/Qwen3-8B --enable-reasoning --reasoning-parser deepseek_r1

然后，可以使用創(chuàng)建聊天接口與通義千問(wèn)進(jìn)行交互：

curl http://localhost:8000/v1/chat/completions -H "Content-Type: application/json" -d '{
  "model": "Qwen/Qwen3-8B",
  "messages": [
    {"role": "user", "content": "Give me a short introduction to large language models."}
  ],
  "temperature": 0.6,
  "top_p": 0.95,
  "top_k": 20,
  "max_tokens": 32768
}'

from openai import OpenAI
# 設(shè)置OpenAI的API密鑰和API基礎(chǔ)地址以使用vLLM的API服務(wù)器
openai_api_key = "EMPTY"
openai_api_base = "http://localhost:8000/v1"

client = OpenAI(
    api_key=openai_api_key,
    base_url=openai_api_base,
)

chat_response = client.chat.completions.create(
    model="Qwen/Qwen3-8B",
    messages=[
        {"role": "user", "content": "Give me a short introduction to large language models."},
    ],
    temperature=0.6,
    top_p=0.95,
    top_k=20,
    max_tokens=32768,
)
print("Chat response:", chat_response)

軟切換始終可用，在vLLM中，也可以通過(guò)以下API調(diào)用配置實(shí)現(xiàn)硬切換。若要禁用思考，可以使用：

curl http://localhost:8000/v1/chat/completions -H "Content-Type: application/json" -d '{
  "model": "Qwen/Qwen3-8B",
  "messages": [
    {"role": "user", "content": "Give me a short introduction to large language models."}
  ],
  "temperature": 0.7,
  "top_p": 0.8,
  "top_k": 20,
  "max_tokens": 8192,
  "presence_penalty": 1.5,
  "chat_template_kwargs": {"enable_thinking": false}
}'

from openai import OpenAI
# 設(shè)置OpenAI的API密鑰和API基礎(chǔ)地址以使用vLLM的API服務(wù)器
openai_api_key = "EMPTY"
openai_api_base = "http://localhost:8000/v1"

client = OpenAI(
    api_key=openai_api_key,
    base_url=openai_api_base,
)

chat_response = client.chat.completions.create(
    model="Qwen/Qwen3-8B",
    messages=[
        {"role": "user", "content": "Give me a short introduction to large language models."},
    ],
    temperature=0.7,
    top_p=0.8,
    top_k=20,
    presence_penalty=1.5,
    extra_body={"chat_template_kwargs": {"enable_thinking": False}},
)
print("Chat response:", chat_response)

6.使用通義千問(wèn)3進(jìn)行開(kāi)發(fā)

下面是在不同框架中使用通義千問(wèn)3的簡(jiǎn)單指南。首先，給出在Hugging Face的Transformers中使用通義千問(wèn)3-30B-A3B的標(biāo)準(zhǔn)示例：

from modelscope import AutoModelForCausalLM, AutoTokenizer

model_name = "Qwen/Qwen3-30B-A3B"
# 加載分詞器和模型
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype="auto",
    device_map="auto"
)
# 準(zhǔn)備模型輸入
prompt = "Give me a short introduction to large language model."
messages = [
    {"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True,
    enable_thinking=True# 在思維模式和非思維模式間切換。默認(rèn)值為True。
)
model_inputs = tokenizer([text], return_tensors="pt").to(model.device)
# 進(jìn)行文本生成
generated_ids = model.generate(
    **model_inputs,
    max_new_tokens=32768
)
output_ids = generated_ids[0][len(model_inputs.input_ids[0]):].tolist()  # 解析思維內(nèi)容
try:
    # rindex查找151668（</think>）
    index = len(output_ids) - output_ids[::-1].index(151668)
except ValueError:
    index = 0
thinking_content = tokenizer.decode(output_ids[:index], skip_special_tokens=True).strip("\n")
content = tokenizer.decode(output_ids[index:], skip_special_tokens=True).strip("\n")
print("thinking content:", thinking_content)
print("content:", content)

若要禁用思考，只需對(duì)??enable_thinking??參數(shù)進(jìn)行如下修改：

text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True,
    enable_thinking=False  # enable_thinking的默認(rèn)值為True
)

在部署方面，可以使用??sglang>=0.4.6.post1???或??vllm>=0.8.4??來(lái)創(chuàng)建與OpenAI兼容的API端點(diǎn)：

SGLang：

python -m sglang.launch_server --model-path Qwen/Qwen3-30B-A3B --reasoning-parser qwen3

vLLM：

vllm serve Qwen/Qwen3-30B-A3B --enable-reasoning --reasoning-parser deepseek_r1

如果是進(jìn)行本地開(kāi)發(fā)，可以使用ollama，通過(guò)運(yùn)行??ollama run qwen3:30b-a3b??這一簡(jiǎn)單命令來(lái)體驗(yàn)?zāi)Ｐ停部梢允褂肔MStudio、llama.cpp和ktransformers進(jìn)行本地構(gòu)建。

7.高級(jí)用法

當(dāng)??enable_thinking=True???時(shí)，通義千問(wèn)3提供了一種軟切換機(jī)制，允許用戶動(dòng)態(tài)控制模型的行為。具體來(lái)說(shuō)，可以在用戶提示或系統(tǒng)消息中添加??/think???和??/no_think??，在不同輪次對(duì)話中切換模型的思維模式。在多輪對(duì)話中，模型會(huì)遵循最新的指令。

以下是一個(gè)多輪對(duì)話的示例：

from transformers import AutoModelForCausalLM, AutoTokenizer

class QwenChatbot:
    def __init__(self, model_name="Qwen/Qwen3-30B-A3B"):
        self.tokenizer = AutoTokenizer.from_pretrained(model_name)
        self.model = AutoModelForCausalLM.from_pretrained(model_name)
        self.history = []

    def generate_response(self, user_input):
        messages = self.history + [{"role": "user", "content": user_input}]
        text = self.tokenizer.apply_chat_template(
            messages,
            tokenize=False,
            add_generation_prompt=True
        )
        inputs = self.tokenizer(text, return_tensors="pt")
        response_ids = self.model.generate(**inputs, max_new_tokens=32768)[0][len(inputs.input_ids[0]):].tolist()
        response = self.tokenizer.decode(response_ids, skip_special_tokens=True)
        # 更新對(duì)話歷史
        self.history.append({"role": "user", "content": user_input})
        self.history.append({"role": "assistant", "content": response})
        return response

# 示例用法
if __name__ == "__main__":
    chatbot = QwenChatbot()
    # 第一次輸入（未包含/think或/no_think標(biāo)簽，默認(rèn)啟用思維模式）
    user_input_1 = "How many r's in strawberries?"
    print(f"User: {user_input_1}")
    response_1 = chatbot.generate_response(user_input_1)
    print(f"Bot: {response_1}")
    print("----------------------")
    # 第二次輸入，包含/no_think
    user_input_2 = "Then, how many r's in blueberries? /no_think"
    print(f"User: {user_input_2}")
    response_2 = chatbot.generate_response(user_input_2)
    print(f"Bot: {response_2}") 
    print("----------------------")
    # 第三次輸入，包含/think
    user_input_3 = "Really? /think"
    print(f"User: {user_input_3}")
    response_3 = chatbot.generate_response(user_input_3)
    print(f"Bot: {response_3}")

8.智能體應(yīng)用

通義千問(wèn)3在工具調(diào)用能力方面表現(xiàn)卓越。建議使用通義千問(wèn)智能體（Qwen-Agent），以便充分發(fā)揮通義千問(wèn)3的智能體能力。通義千問(wèn)智能體內(nèi)部封裝了工具調(diào)用模板和工具調(diào)用解析器，極大地降低了編碼復(fù)雜度。

在定義可用工具時(shí)，你可以使用模型上下文協(xié)議（MCP）配置文件，也可以使用通義千問(wèn)智能體的集成工具，或者自行集成其他工具。

from qwen_agent.agents import Assistant

# 定義大語(yǔ)言模型
llm_cfg = {
   'model': 'Qwen3-30B-A3B',
    # 使用阿里巴巴模型平臺(tái)提供的端點(diǎn)：
    #'model_type': 'qwen_dashscope',
    # 'api_key': os.getenv('DASHSCOPE_API_KEY'),
    # 使用與OpenAI API兼容的自定義端點(diǎn)：
   'model_server': 'http://localhost:8000/v1',  # api_base
    'api_key': 'EMPTY',
    # 其他參數(shù)：
    # 'generate_cfg': {
    #         # 添加：當(dāng)響應(yīng)內(nèi)容為`<think>這是思考內(nèi)容</think>這是答案`時(shí)；
    #         # 不添加：當(dāng)響應(yīng)已按推理內(nèi)容和答案分開(kāi)時(shí)。
    #         'thought_in_content': True,
    #     },
}
# 定義工具
tools = [
    {'mcpServers': {  # 可以指定MCP配置文件
            'time': {
                'command': 'uvx',
                'args': ['mcp-server-time', '--local-timeznotallow=Asia/Shanghai']
            },
            "fetch": {
                "command": "uvx",
                "args": ["mcp-server-fetch"]
            }
        }
    },
    'code_interpreter',  # 內(nèi)置工具
]
# 定義智能體
bot = Assistant(llm=llm_cfg, function_list=tools)
# 流式生成
messages = [{'role': 'user', 'content': 'https://qwenlm.github.io/blog/ Introduce the latest developments of Qwen'}]
for responses in bot.run(messages=messages):
    pass
print(responses)

9.未來(lái)展望

通義千問(wèn)3是邁向通用人工智能（AGI）和超級(jí)人工智能（ASI）征程中的一個(gè)重要里程碑。通過(guò)擴(kuò)大預(yù)訓(xùn)練和強(qiáng)化學(xué)習(xí)（RL）的規(guī)模，通義千問(wèn)3實(shí)現(xiàn)了更高水平的智能。它無(wú)縫集成了思維模式和非思維模式，使用戶能夠靈活控制思維預(yù)算。此外，通義千問(wèn)3擴(kuò)展了對(duì)多種語(yǔ)言的支持，提高了全球可訪問(wèn)性。

Qwen3震撼發(fā)布，問(wèn)鼎開(kāi)源寶座，教你快速上手-AI.x社區(qū)

在人工智能技術(shù)持續(xù)演進(jìn)的當(dāng)下，阿里巴巴著眼未來(lái)，致力于多維度提升模型性能。其策略包括優(yōu)化模型架構(gòu)和訓(xùn)練方法，實(shí)現(xiàn)拓展數(shù)據(jù)規(guī)模、增加模型參數(shù)、延長(zhǎng)上下文長(zhǎng)度、拓寬模態(tài)、推進(jìn)強(qiáng)化學(xué)習(xí)等目標(biāo)。

行業(yè)正從以訓(xùn)練模型為核心，邁向以訓(xùn)練智能體為核心的時(shí)代。通義千問(wèn) 3 的下一次迭代有望實(shí)現(xiàn)技術(shù)突破，為人們的工作和生活帶來(lái)積極改變，助力各領(lǐng)域智能化升級(jí)。

本文轉(zhuǎn)載自???AI科技論談??????，作者：AI科技論談

標(biāo)簽

Qwen3

開(kāi)源

人工智能

贊

回復(fù)