OpenAI宣布封禁?阿里Qwen2直接登頂開源榜首
自22年Chatgpt橫空出世來,這項技術改變了世界,也改變了很多人的命運。
圖形界面讓計算機開始走進千家萬戶,智能手機更進一步讓互聯網人人可用,而現在大模型將成為新一代人機交互接口,這勢必將掀起一場革命。
這場革命中國正在奮起直追,其中代表性事件就是阿里最新開源的Qwen2登頂。
就在上周,全球著名開源平臺huggingface(開源模型網站,類似AI屆的GitHub)的聯合創始人兼首席執行官Clem在海外社交平臺宣布,阿里最新開源的Qwen2-72B指令微調版本,性能超過美國最強的開源模型Llama3-70B,成為開源模型排行榜第一名。
圖片
Clem表示,為了提供全新的開源大模型排行榜,使用了300塊H100對目前全球100多個主流開源大模型,例如,Qwen2、Llama-3、mixtral等,結果顯示,阿里開源的Qwen-2 72B力壓科技、社交巨頭Meta的Llama-3、法國著名大模型平臺Mistralai的Mixtral成為新的王者,中國在全球開源大模型領域處于領導地位。
而恰逢OpenAI宣布終止對中國提供API服務之際,阿里云百煉平臺第一時間宣布,將為OpenAI API用戶提供最具性價比的中國大模型替代方案,并為中國開發者提供2200萬免費tokens和專屬遷移服務。
讓我們來看看阿里通義千問與國外各大模型的巔峰對決。
6月7日,Qwen2發布后,僅2小時,Qwen2-72B登頂HuggingFace 開源大模型榜單Open LLM Leaderboard第一名,全球排名最高。
6月14日,Qwen2拿下美國最新測評榜單開源大模型全球第一。
Qwen2-72B在圖靈獎得主、Meta首席AI科學家楊立昆(Yann LeCun)聯合Abacus.AI、紐約大學等機構推出全新的大模型測評基準LiveBench AI中,在開源大模型中排名世界第一,也是十榜單中唯一的開源大模型、唯一的中國大模型。
圖片
6月20日,Qwen2在斯坦福大學的大模型測評榜單HELM MMLU中,成為開源模型第一。
MMLU(Massive Multitask Language Understanding,大規模多任務語言理解)是業界最有影響力的大模型測評基準之一,涵蓋了基礎數學、計算機科學、法律、歷史等57項任務,用以測試大模型的世界知識和問題解決能力。
圖片
阿里Qwen2的登頂證明了中國在大模型領域有能力達到領先水平。
開源可以讓企業以更低的成本使用,充分對各業務場景賦能。除了開源大模型,阿里云百煉平臺匯聚了眾多開發者,并配備了完善的工具鏈,而且還能充分保障客戶的數據安全,這一點得到了零一萬物創始人兼CEO,前Google、微軟、蘋果全球副總裁李開復的肯定。
也有很多海外開發者在使用阿里開源大模型Qwen2后認為是自Llama 3以來最具影響力的開源LLM:
圖片
Qwen2的編碼和推理能力比同等規模的 llama-3-8b 更好,無需專門訓練即可編寫俄羅斯方塊游戲。
圖片
Qwen 2-72b在幾乎所有測試中都比llama3 70b效果更好,盡管尺寸相對較小,但卻非常聰明和富有創意,可以在本地運行。
最后,OpenAI用不了?沒關系,我們有自己的國產大模型。