英偉達出手即王炸!重磅開源Nemotron大模型:擊敗GPT-4o、僅次于o1! 原創
編譯 | 伊風
出品 | 51CTO技術棧(微信號:blog51cto)
英偉達悶聲干大事!什么炒作也沒有,直接開源媲美GPT-4o、僅次于o1的模型!
圖片
英偉達(Nvidia)在周二悄然發布了一款新型人工智能模型,性能超越了行業領導者OpenAI和Anthropic的產品,這標志著公司人工智能戰略的重大轉變,并可能重新塑造該領域的競爭格局。
這款名為Llama-3.1-Nemotron-70B-Instruct的模型悄無聲息地出現在熱門的人工智能平臺Hugging Face上,憑借其在多個基準測試中出色的表現,迅速引起了關注。
項目地址:https://huggingface.co/nvidia/Llama-3.1-Nemotron-70B-Instruct-HF
英偉達報告稱,新的產品在關鍵評估中取得了優異成績,包括在 Arena Hard 基準測試中得分85.0,在 AlpacaEval 2 LC 中得分 57.6,以及在 GPT-4-Turbo MT-Bench 中得分 8.98 。
這些得分超過了OpenAI的GPT-4o和Anthropic的Claude 3.5 Sonnet等備受推崇的模型,使英偉達躋身人工智能語言理解與生成的前沿。
1.英偉達的人工智能戰略:從GPU巨頭到LLM先鋒
這一發布代表了英偉達的一個關鍵時刻。該公司主要以圖形處理單元(GPU)的巨頭身份聞名,這些GPU為人工智能系統提供動力,但現在它展示了開發復雜人工智能軟件的能力。這一舉措標志著英偉達戰略擴張的開始,可能會改變人工智能行業的格局,挑戰傳統的軟件公司在大語言模型開發中的主導地位。
英偉達開發Llama-3.1-Nemotron-70B-Instruct的方式是,利用先進的訓練技術,包括“從人類反饋中學習的強化學習”(RLHF),對Meta的開源Llama 3.1模型進行了優化。這種方法使人工智能能夠從人類的偏好中學習,可能會帶來更加自然和符合語境的回應。
憑借其卓越的性能,這款模型有潛力為企業提供一個更有能力且更具成本效益的替代方案,挑戰市場上一些最先進的模型。
該模型能夠在無需額外提示或特殊標記的情況下處理復雜查詢,這是它的一個突出特點。在一次演示中,它正確地回答了“草莓里有多少個r?”這個問題,給出了詳細且準確的回應,展示了對語言的深刻理解和提供清晰解釋的能力。
這些結果的特別重要之處在于強調了“對齊”(alignment)這一概念,這是人工智能研究中的一個術語,指的是模型輸出與用戶需求和偏好的匹配程度。對企業來說,這意味著減少錯誤、提供更有幫助的回應,最終提高客戶滿意度。
2.英偉達的新模型如何重塑商業和研究
對于企業和組織而言,英偉達的這一模型提供了一個非常有吸引力的新選項。該公司通過其build.nvidia.com平臺提供免費的托管推理服務,并配有與OpenAI兼容的API接口。
這種可訪問性使得先進的人工智能技術更加普及,允許更多公司實驗并實現先進的語言模型。
這一發布還突顯了人工智能領域逐漸向不僅強大而且可定制的模型轉變。如今,企業需要能夠根據其特定需求量身定制的人工智能,無論是處理客戶服務查詢,還是生成復雜報告。英偉達的模型提供了這種靈活性,并且具有頂級的性能,使其成為各行業企業的有力競爭選項。
然而,隨著這些強大的技術的推出,也伴隨著責任。如同任何人工智能系統一樣,Llama-3.1-Nemotron-70B-Instruct也無法避免風險。英偉達已提醒用戶,該模型并未針對數學或法律推理等專業領域進行調優,這些領域對準確性要求至關重要。企業需要確保合理使用該模型,并采取必要的保障措施以防止錯誤或濫用。
3.人工智能軍備競賽加劇:英偉達的大膽舉措挑戰科技巨頭
英偉達最新的模型發布顯示了人工智能領域變化的速度。盡管Llama-3.1-Nemotron-70B-Instruct的長期影響尚不確定,但這一發布無疑標志著在構建最先進人工智能系統的競爭中一個明顯的轉折點。
通過從硬件向高性能人工智能軟件的轉型,英偉達迫使其他廠商重新考慮他們的戰略,并加快自己的研發步伐。這一切發生在公司推出NVLM 1.0系列多模態模型之后,其中包括72億參數的NVLM-D-72B。
這些最新的發布,特別是開源的NVLM項目,表明英偉達的人工智能雄心不僅僅是與競爭對手抗衡——它們挑戰了像GPT-4o這樣專有系統在從圖像解析到解決復雜問題等領域的主導地位。
這些發布的快速接連突顯了英偉達在人工智能軟件開發領域的雄心。通過提供與行業領導者競爭的多模態和文本專用模型,英偉達正在將自己定位為一個全面的人工智能解決方案提供商,利用其硬件專長開發出強大且易于獲取的軟件工具。
英偉達的戰略似乎很明確:它正在將自己定位為一個全方位的人工智能服務提供商,結合硬件專長與高性能的軟件。這一舉措可能會重塑整個行業,迫使競爭對手加速創新,并可能激發更多開源合作。
隨著開發者對Llama-3.1-Nemotron-70B-Instruct的測試,我們很可能會看到該模型在醫療、金融、教育等領域的新應用出現。它的成功將最終取決于是否能夠將令人印象深刻的基準得分轉化為實際的解決方案。
未來幾個月,人工智能社區將密切關注Llama-3.1-Nemotron-70B-Instruct在現實應用中的表現,超越基準測試。其能否將高得分轉化為實際的、具有價值的解決方案,將最終決定其對行業和社會的長期影響。
英偉達深入開發人工智能模型,已經加劇了競爭。如果這是人工智能新紀元的開始,那么它是一個完全整合的解決方案可能會為未來的突破定下節奏。
本文轉載自51CTO技術棧,作者:言征
