通義千問720億參數模型開源，率先實現“全尺寸全模態”開源

2023-12-01 13:36:01

隨著Qwen-72B的開源，通義千問還開源了18億參數模型Qwen-1.8B和音頻大模型Qwen-Audio。至此，通義千問共開源18億、70億、140億、720億參數的4款大語言模型，以及視覺理解、音頻理解兩款多模態大模型，實現“全尺寸、全模態”開源。

12月1日，阿里云通義千問720億參數模型Qwen-72B宣布開源。該模型基于3T tokens高質量數據訓練，在10個權威基準測評中奪得開源模型最優成績，在部分測評中超越閉源的GPT-3.5和GPT-4。

在英語任務上，Qwen-72B在MMLU基準測試取得開源模型最高分；中文任務上，Qwen-72B在C-Eval、CMMLU、GaokaoBench等基準得分超越GPT-4；數學推理方面，Qwen-72B在GSM8K、MATH測評中斷層式領先其他開源模型；代碼理解方面，Qwen-72B在HumanEval、MBPP等測評中的表現大幅提升，代碼能力有了質的飛躍。

據介紹，Qwen-72B可以處理最多32k的長文本輸入，在長文本理解測試集LEval上取得了超越ChatGPT-3.5-16k的效果。研發團隊優化了Qwen-72B的指令遵循、工具使用等技能，使之能更好地被下游應用集成。比如，Qwen-72B搭載了強大的系統指令（System Prompt）能力，用戶只用一句提示詞就可定制AI助手，要求大模型扮演某個角色或者執行特定的回復任務。

在10大權威測評中，通義千問720億參數模型獲得開源模型最優成績

通義千問720億開源模型部分成績超越閉源的GPT-3.5和GPT-4

用戶僅用一句提示詞就可創建自己的AI助手

此前，中國大模型市場還沒出現足以對標Llama 2-70B的優質開源模型。Qwen-72B填補了國內空白，以高性能、高可控、高性價比的優勢，提供不亞于商業閉源大模型的選擇。基于Qwen-72B，大中型企業可開發商業應用，高校、科研院所可開展AI for Science等科研工作。

從1.8B到72B，通義千問率先實現全尺寸開源

如果說Qwen-72B“向上摸高”，抬升了開源大模型的尺寸和性能天花板；發布會上的另一開源模型Qwen-1.8B則“向下探底”，成為尺寸最小的中國開源大模型，推理2K長度文本內容僅需3G顯存，可在消費級終端部署。

從18億、70億、140億到720億參數規模，通義千問成為業界首個“全尺寸開源”的大模型。用戶可在魔搭社區直接體驗Qwen系列模型效果，也可通過阿里云靈積平臺調用模型API，或基于阿里云百煉平臺定制大模型應用。阿里云人工智能平臺PAI針對通義千問全系列模型進行深度適配，推出了輕量級微調、全參數微調、分布式訓練、離線推理驗證、在線服務部署等服務。

阿里云是國內最早開源自研大模型的科技企業，8月以來開源了Qwen-7B、Qwen-14B和視覺理解模型Qwen-VL。幾款模型先后沖上HuggingFace、Github大模型榜單，得到中小企業和個人開發者的青睞，累計下載量超過150萬，催生出150多款新模型、新應用。發布會現場，多位開發者伙伴現身說法，分享了他們用Qwen開發專屬模型和特定應用的實踐。

阿里云CTO周靖人表示，開源生態對促進中國大模型的技術進步與應用落地至關重要，通義千問將持續投入開源，希望成為“AI時代最開放的大模型”，與伙伴們共同促進大模型生態建設。

通義千問基座模型持續進化，多模態探索業界領先

通義千問在多模態大模型領域的探索也領先業界一步，當天，阿里云首次開源音頻理解大模型Qwen-Audio。

Qwen-Audio能夠感知和理解人聲、自然聲、動物聲、音樂聲等各類語音信號。用戶可以輸入一段音頻，要求模型給出對音頻的理解，甚至基于音頻進行文學創作、邏輯推理、故事續寫等等。音頻理解能夠賦予大模型接近人類的聽覺能力。

通義大模型能“聽”也能“看”。通義千問8月開源出視覺理解大模型Qwen-VL，迅速成為國際開源社區最佳實踐之一。本次發布會又宣布了Qwen-VL的重大更新，大幅提升通用OCR、視覺推理、中文文本理解基礎能力，還能處理各種分辨率和規格的圖像，甚至能“看圖做題”。不論從權威測評成績還是真人體驗的效果看，Qwen-VL的中文文本理解能力都大幅超越了GPT-4V。

通義千問閉源模型也在持續進化，一個月前發布的通義千問2.0版閉源模型，最近已進階至2.1版，上下文窗口長度擴展到32k，代碼理解生成能力、數學推理能力、中英文百科知識、幻覺誘導抵抗能力分別提升30%、10%、近5%和14%。用戶可以在通義千問APP免費體驗最新版本的閉源模型。

首屆通義千問AI挑戰賽開賽，參賽者可暢玩通義開源模型家族

12月1日，首屆“通義千問AI挑戰賽”開賽，參賽者可免費暢玩通義開源模型家族，包括剛剛發布的720億參數模型Qwen-72B。主辦方為參賽者提供價值50萬元的免費云上算力和豐厚獎金。賽事分為算法和Agent兩大賽道，前者聚焦通義千問大模型的微調訓練，希望通過高質量的數據探索開源模型的代碼能力上限，后者鼓勵開發者基于通義千問大模型和魔搭社區的Agent-Builder框架開發新一代AI應用，促進大模型在各行各業的落地應用。即日起開發者可通過天池平臺報名參賽。

責任編輯：鳶瑋來源：阿里云

阿里云通義千問

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

通義千問720億參數模型開源，率先實現“全尺寸全模態”開源