打上“業界最強”標簽:阿里通義千問沖擊國產大模型No.1
每個時代都有自己的主旋律,下一個十年的主旋律就是AI!
自ChatGPT橫空出世以后,國內的各種大模型也如雨后春筍般涌現,能叫得上號就不下十余個,其中就包括大名鼎鼎的華為盤古大模型、百度文心一言大模型、訊飛星火大模型、抖音云雀大模型,以及今天的主角阿里通義千問大模型。
據極客網不完全統計,國內擁有10億參數規模以上大模型的廠商及機構已接近300家,而且還在快速增加中。預計到2024年第一季度末,“百模大戰”就會升級為“千模大戰”!
圖:部分國內知名大模型
上一次出現如此“壯觀”的景象,還是十年前的互聯網團購。不過,這兩者之間有著本質的不同。“千模大戰”已由“千團大戰”的資本驅動型、營銷驅動型,轉向了研發驅動型、技術驅動型。這與中國產業升級正在追求的高質量發展不謀而合,“千模大戰”拼的不再是錢和套路,而是實打實的技術創新能力。
作為互聯網時代最大的受益者和贏家之一,阿里有極強的商業嗅覺,是最早一批全面轉型“硬科技”研發的互聯網巨頭之一,在AI大模型領域也成功躋身第一梯隊。2023年,阿里通義千問大模型在技術、商業、生態三方面,都取得了突破性時展,國產AI大模型之王,很可能就是阿里!
首次打上“業界最強”標簽
12月1日,阿里云在北京召開發布會,發布通義千問閉源模型2.1版,升級通義千問視覺理解模型Qwen-VL,并開源通義千問720億參數模型Qwen-72B。從18億、70億、140億到720億參數規模,通義千問成為業界首個“全尺寸開源”的大模型。這預示著,阿里通義千問自4月發布以來,終于迎來了一次史詩級大升級。
圖:阿里通義千問發布會現場
通過橫向對比不難發現,Qwen-72B是目前業界最強的開源中文大模型,在10個權威基準測評中,都創下開源模型最優成績。尤其在中文任務模式下,Qwen-72B霸榜C-Eval、CMMLU、GaokaoBench等基準,得分超越GPT-4;數學推理方面,Qwen-72B在GSM8K、MATH測評中斷層式領先其他開源模型;代碼理解方面,Qwen-72B在HumanEval、MBPP等測評中的表現大幅提升,代碼能力有了質的飛躍。
在英語任務中,Qwen-72B的MMLU基準測試也取得開源模型最高分。也就是說,Qwen-72B不僅在性能上超越了開源標桿Llama 2-70B和大部分商用閉源模型。未來,企業級、科研級的高性能應用,也有了開源大模型這一選項。
圖:在10大權威測評中,通義千問720億參數模型獲得開源模型最優成績
圖:通義千問720億開源模型部分成績超越閉源的GPT-3.5和GPT-4
另外,通義千問2.1也有了大幅升級,在復雜指令理解、文學創作、通用數學、知識記憶、幻覺抵御等能力都有肉眼可見的提升。具體表現為:代碼生成理解能力提升了30%、幻覺誘導抵抗提升了14%、數學邏輯推理能力提升了10%、中英百科知識增加了5%。
在競爭激烈的大模型領域,每一小步提升,都意味著更大的競爭優勢,所以大廠們無時不刻都在向著更高的技術指標進級。在這種情況下,阿里通義千問只用了短短6個多月的時間,就從絕對落后做到了部分領先,這是極期難能可貴的。未來三到五年,如果阿里可以一直保持如此迅猛的發展態勢,完全有機會沖擊國產AI大模型之巔,再次成為新科技時代的No.1。
構筑堅不可摧的“技術護城河”
前文提到,AI大模型拼的不再是資本和營銷,而是實打實的技術創新。沒有核心優勢的企業,都會隨著技術的快速迭代,慢慢湮沒在滾滾歷史洪流中。和“千團大戰”的結局類似,只有極少數大模型公司能夠“笑到最后”。作為最早轉型“硬科技”的互聯網巨頭之一,阿里經過十余年的技術積淀,已初步具備穿越周期的條件。
對于AI大模型來說,核心技術環節有三個,一是數據,二是算法,三是算力。作為中國最大的互聯網巨頭之一,阿里在數據方面有著天然的優勢,尤其是涉及交易細節的電商數據,阿里優勢更加明顯。在算法方面,盡管阿里起步稍晚,但目前已經無限接近GPT-4,部分細分領域還實現了超越。站在歷史角度看,中國企業在數據算法領域從來沒輸過,所以這部分的反超指日可待。
相比數據、算法,最關鍵的還是算力!現在大模型企構建算力的唯一途徑,就是購買更多、更先進的算力基礎設施。而算力基礎設施中,最核心的部件就是AI算力芯片。目前,AI算力芯片做得最好的,非英偉達莫屬。其最新發布的H200,擁有141GB的內存,處理速度高達4.8TB/秒,綜合性能是上一代的兩倍。這款芯片將給AI大模型企業帶來極大的助力。
圖:英偉達H200性能
然而,由于眾所周知的原因,英偉達H200等美國尖端AI芯片,并不能賣給中國企業。中國企業要想在新一輪產業變革中掌握主動權,自力更生成了必選項。
在國內,除了華為之外,阿里是極少數在做自研芯片,且已經做出成績的公司之一。其重磅推薦出的含光800一度成為全球最強AI推理芯片。近幾年,阿里旗下芯片平臺平頭哥,先后發布鐵 910、無劍 SoC 平臺。就在上個月,阿里玄鐵RISC-V又上新了三款處理器:首次實現AI矩陣擴展的C907、滿足Vector1.0標準的C920,以及實時處理器R910。截止目前,阿里平頭哥已累計售出30億顆RISC-V芯片,占據該市場全球30%的份額。其中,玄鐵CPU的出貨量已經超過了25億顆,成為了國內應用規模最大的國產CPU。
圖:阿里平頭哥芯片產品一覽
毫無疑問,平頭哥已成國產芯片不容忽略的一極。而在芯片領域做出了突破,也就意味著在算力基礎設施建設方面有了更大的主動權。借此,阿里不僅可以幫助自己在大模型領域,構筑一條堅不可摧的“技術護城河”,還可以打破國外壟斷,為國內其它相關企業的自主創新提供強有力的支持。未來,阿里云將不斷壯大自身產業生態,并發展成為整個行業的賦能者。
事實上,不只通義千問,目前中國一半大模型公司,都跑在阿里云上。阿里云CTO周靖人稱,阿里云將不斷開放平臺能力,幫助更多企業實現大模型商業價值。
阿里這么說,也是這么做的。比如,阿里云剛剛發布的一站式大模型應用開發平臺——阿里云百煉,就集成了國內外主流優質大模型,可以提供模型選型、微調訓練、安全套件、模型部署等服務和全鏈路的應用開發工具,為用戶簡化了底層算力部署、模型預訓練、工具開發等復雜工作。開發者可在5分鐘內開發一款大模型應用,幾小時即可“煉”出一個企業專屬模型,開發者可把更多精力專注于應用創新。
圖:阿里云百煉平臺
截至2023年10月,阿里云已與60多個行業頭部伙伴進行深度合作,推動通義千問在辦公、文旅、電力、政務、醫保、交通、制造、金融、軟件開發等領域的落地。這個成績,無疑再一次跑贏了絕大部分競爭者。總之,憑借獨有的技術優勢和生態布局,阿里通義千問是最有機會成為行業的領頭羊的大模型。
寫在最后:
生成式AI爆火,千模大戰加速上演。作為最早轉型“硬科技”的互聯網巨頭之一,阿里憑借十余年積淀下來的技術優勢,在數據、算法、算力三大核心環節,構筑了一條堅不可摧的護城河,還率先推出業界最強的720億參數開源中文大模型Qwen-72B。未來,隨著阿里云生態的不斷壯大,阿里通義千問將成為最有機會登頂行業之巔的大模型。站在中國產業升級的大維度來看,阿里在AI領域的持續投入,無疑再一次押對了大勢。期待阿里這個龐然大物,在新一輪產業變革中成功完成轉型、蛻變!(完)