打上“業界最強”標簽：阿里通義千問沖擊國產大模型No.1

作者：海剛 2023-12-04 09:55:58

國內擁有10億參數規模以上大模型的廠商及機構已接近300家，而且還在快速增加中。預計到2024年第一季度末，“百模大戰”就會升級為“千模大戰”！

每個時代都有自己的主旋律，下一個十年的主旋律就是AI！

自ChatGPT橫空出世以后，國內的各種大模型也如雨后春筍般涌現，能叫得上號就不下十余個，其中就包括大名鼎鼎的華為盤古大模型、百度文心一言大模型、訊飛星火大模型、抖音云雀大模型，以及今天的主角阿里通義千問大模型。

據極客網不完全統計，國內擁有10億參數規模以上大模型的廠商及機構已接近300家，而且還在快速增加中。預計到2024年第一季度末，“百模大戰”就會升級為“千模大戰”！

圖：部分國內知名大模型

上一次出現如此“壯觀”的景象，還是十年前的互聯網團購。不過，這兩者之間有著本質的不同。“千模大戰”已由“千團大戰”的資本驅動型、營銷驅動型，轉向了研發驅動型、技術驅動型。這與中國產業升級正在追求的高質量發展不謀而合，“千模大戰”拼的不再是錢和套路，而是實打實的技術創新能力。

作為互聯網時代最大的受益者和贏家之一，阿里有極強的商業嗅覺，是最早一批全面轉型“硬科技”研發的互聯網巨頭之一，在AI大模型領域也成功躋身第一梯隊。2023年，阿里通義千問大模型在技術、商業、生態三方面，都取得了突破性時展，國產AI大模型之王，很可能就是阿里！

首次打上“業界最強”標簽

12月1日，阿里云在北京召開發布會，發布通義千問閉源模型2.1版，升級通義千問視覺理解模型Qwen-VL，并開源通義千問720億參數模型Qwen-72B。從18億、70億、140億到720億參數規模，通義千問成為業界首個“全尺寸開源”的大模型。這預示著，阿里通義千問自4月發布以來，終于迎來了一次史詩級大升級。

圖：阿里通義千問發布會現場

通過橫向對比不難發現，Qwen-72B是目前業界最強的開源中文大模型，在10個權威基準測評中，都創下開源模型最優成績。尤其在中文任務模式下，Qwen-72B霸榜C-Eval、CMMLU、GaokaoBench等基準，得分超越GPT-4；數學推理方面，Qwen-72B在GSM8K、MATH測評中斷層式領先其他開源模型；代碼理解方面，Qwen-72B在HumanEval、MBPP等測評中的表現大幅提升，代碼能力有了質的飛躍。

在英語任務中，Qwen-72B的MMLU基準測試也取得開源模型最高分。也就是說，Qwen-72B不僅在性能上超越了開源標桿Llama 2-70B和大部分商用閉源模型。未來，企業級、科研級的高性能應用，也有了開源大模型這一選項。

圖：在10大權威測評中，通義千問720億參數模型獲得開源模型最優成績

圖：通義千問720億開源模型部分成績超越閉源的GPT-3.5和GPT-4

另外，通義千問2.1也有了大幅升級，在復雜指令理解、文學創作、通用數學、知識記憶、幻覺抵御等能力都有肉眼可見的提升。具體表現為：代碼生成理解能力提升了30%、幻覺誘導抵抗提升了14%、數學邏輯推理能力提升了10%、中英百科知識增加了5%。

在競爭激烈的大模型領域，每一小步提升，都意味著更大的競爭優勢，所以大廠們無時不刻都在向著更高的技術指標進級。在這種情況下，阿里通義千問只用了短短6個多月的時間，就從絕對落后做到了部分領先，這是極期難能可貴的。未來三到五年，如果阿里可以一直保持如此迅猛的發展態勢，完全有機會沖擊國產AI大模型之巔，再次成為新科技時代的No.1。

構筑堅不可摧的“技術護城河”

前文提到，AI大模型拼的不再是資本和營銷，而是實打實的技術創新。沒有核心優勢的企業，都會隨著技術的快速迭代，慢慢湮沒在滾滾歷史洪流中。和“千團大戰”的結局類似，只有極少數大模型公司能夠“笑到最后”。作為最早轉型“硬科技”的互聯網巨頭之一，阿里經過十余年的技術積淀，已初步具備穿越周期的條件。

對于AI大模型來說，核心技術環節有三個，一是數據，二是算法，三是算力。作為中國最大的互聯網巨頭之一，阿里在數據方面有著天然的優勢，尤其是涉及交易細節的電商數據，阿里優勢更加明顯。在算法方面，盡管阿里起步稍晚，但目前已經無限接近GPT-4，部分細分領域還實現了超越。站在歷史角度看，中國企業在數據算法領域從來沒輸過，所以這部分的反超指日可待。

相比數據、算法，最關鍵的還是算力！現在大模型企構建算力的唯一途徑，就是購買更多、更先進的算力基礎設施。而算力基礎設施中，最核心的部件就是AI算力芯片。目前，AI算力芯片做得最好的，非英偉達莫屬。其最新發布的H200，擁有141GB的內存，處理速度高達4.8TB/秒，綜合性能是上一代的兩倍。這款芯片將給AI大模型企業帶來極大的助力。

圖：英偉達H200性能

然而，由于眾所周知的原因，英偉達H200等美國尖端AI芯片，并不能賣給中國企業。中國企業要想在新一輪產業變革中掌握主動權，自力更生成了必選項。

在國內，除了華為之外，阿里是極少數在做自研芯片，且已經做出成績的公司之一。其重磅推薦出的含光800一度成為全球最強AI推理芯片。近幾年，阿里旗下芯片平臺平頭哥，先后發布鐵 910、無劍 SoC 平臺。就在上個月，阿里玄鐵RISC-V又上新了三款處理器：首次實現AI矩陣擴展的C907、滿足Vector1.0標準的C920，以及實時處理器R910。截止目前，阿里平頭哥已累計售出30億顆RISC-V芯片，占據該市場全球30%的份額。其中，玄鐵CPU的出貨量已經超過了25億顆，成為了國內應用規模最大的國產CPU。

圖：阿里平頭哥芯片產品一覽

毫無疑問，平頭哥已成國產芯片不容忽略的一極。而在芯片領域做出了突破，也就意味著在算力基礎設施建設方面有了更大的主動權。借此，阿里不僅可以幫助自己在大模型領域，構筑一條堅不可摧的“技術護城河”，還可以打破國外壟斷，為國內其它相關企業的自主創新提供強有力的支持。未來，阿里云將不斷壯大自身產業生態，并發展成為整個行業的賦能者。

事實上，不只通義千問，目前中國一半大模型公司，都跑在阿里云上。阿里云CTO周靖人稱，阿里云將不斷開放平臺能力，幫助更多企業實現大模型商業價值。

阿里這么說，也是這么做的。比如，阿里云剛剛發布的一站式大模型應用開發平臺——阿里云百煉，就集成了國內外主流優質大模型，可以提供模型選型、微調訓練、安全套件、模型部署等服務和全鏈路的應用開發工具，為用戶簡化了底層算力部署、模型預訓練、工具開發等復雜工作。開發者可在5分鐘內開發一款大模型應用，幾小時即可“煉”出一個企業專屬模型，開發者可把更多精力專注于應用創新。

圖：阿里云百煉平臺

截至2023年10月，阿里云已與60多個行業頭部伙伴進行深度合作，推動通義千問在辦公、文旅、電力、政務、醫保、交通、制造、金融、軟件開發等領域的落地。這個成績，無疑再一次跑贏了絕大部分競爭者。總之，憑借獨有的技術優勢和生態布局，阿里通義千問是最有機會成為行業的領頭羊的大模型。

寫在最后：

生成式AI爆火，千模大戰加速上演。作為最早轉型“硬科技”的互聯網巨頭之一，阿里憑借十余年積淀下來的技術優勢，在數據、算法、算力三大核心環節，構筑了一條堅不可摧的護城河，還率先推出業界最強的720億參數開源中文大模型Qwen-72B。未來，隨著阿里云生態的不斷壯大，阿里通義千問將成為最有機會登頂行業之巔的大模型。站在中國產業升級的大維度來看，阿里在AI領域的持續投入，無疑再一次押對了大勢。期待阿里這個龐然大物，在新一輪產業變革中成功完成轉型、蛻變!（完）

責任編輯：龐桂玉來源：極客網

AI大模型

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

打上“業界最強”標簽：阿里通義千問沖擊國產大模型No.1

首次打上“業界最強”標簽

構筑堅不可摧的“技術護城河”

寫在最后：