英偉達出手即王炸！重磅開源Nemotron大模型：擊敗GPT-4o、僅次于o1！原創

51CTO技術棧

發布于 2024-10-17 14:35

瀏覽

0收藏

編譯 | 伊風

出品 | 51CTO技術棧（微信號：blog51cto）

英偉達悶聲干大事！什么炒作也沒有，直接開源媲美GPT-4o、僅次于o1的模型！

英偉達出手即王炸！重磅開源Nemotron大模型：擊敗GPT-4o、僅次于o1！-AI.x社區圖片

英偉達（Nvidia）在周二悄然發布了一款新型人工智能模型，性能超越了行業領導者OpenAI和Anthropic的產品，這標志著公司人工智能戰略的重大轉變，并可能重新塑造該領域的競爭格局。

這款名為Llama-3.1-Nemotron-70B-Instruct的模型悄無聲息地出現在熱門的人工智能平臺Hugging Face上，憑借其在多個基準測試中出色的表現，迅速引起了關注。

項目地址：https://huggingface.co/nvidia/Llama-3.1-Nemotron-70B-Instruct-HF

英偉達報告稱，新的產品在關鍵評估中取得了優異成績，包括在 Arena Hard 基準測試中得分85.0，在 AlpacaEval 2 LC 中得分 57.6，以及在 GPT-4-Turbo MT-Bench 中得分 8.98 。

這些得分超過了OpenAI的GPT-4o和Anthropic的Claude 3.5 Sonnet等備受推崇的模型，使英偉達躋身人工智能語言理解與生成的前沿。

1.英偉達的人工智能戰略：從GPU巨頭到LLM先鋒

這一發布代表了英偉達的一個關鍵時刻。該公司主要以圖形處理單元（GPU）的巨頭身份聞名，這些GPU為人工智能系統提供動力，但現在它展示了開發復雜人工智能軟件的能力。這一舉措標志著英偉達戰略擴張的開始，可能會改變人工智能行業的格局，挑戰傳統的軟件公司在大語言模型開發中的主導地位。

英偉達開發Llama-3.1-Nemotron-70B-Instruct的方式是，利用先進的訓練技術，包括“從人類反饋中學習的強化學習”（RLHF），對Meta的開源Llama 3.1模型進行了優化。這種方法使人工智能能夠從人類的偏好中學習，可能會帶來更加自然和符合語境的回應。

憑借其卓越的性能，這款模型有潛力為企業提供一個更有能力且更具成本效益的替代方案，挑戰市場上一些最先進的模型。

該模型能夠在無需額外提示或特殊標記的情況下處理復雜查詢，這是它的一個突出特點。在一次演示中，它正確地回答了“草莓里有多少個r？”這個問題，給出了詳細且準確的回應，展示了對語言的深刻理解和提供清晰解釋的能力。

這些結果的特別重要之處在于強調了“對齊”（alignment）這一概念，這是人工智能研究中的一個術語，指的是模型輸出與用戶需求和偏好的匹配程度。對企業來說，這意味著減少錯誤、提供更有幫助的回應，最終提高客戶滿意度。

2.英偉達的新模型如何重塑商業和研究

對于企業和組織而言，英偉達的這一模型提供了一個非常有吸引力的新選項。該公司通過其build.nvidia.com平臺提供免費的托管推理服務，并配有與OpenAI兼容的API接口。

這種可訪問性使得先進的人工智能技術更加普及，允許更多公司實驗并實現先進的語言模型。

這一發布還突顯了人工智能領域逐漸向不僅強大而且可定制的模型轉變。如今，企業需要能夠根據其特定需求量身定制的人工智能，無論是處理客戶服務查詢，還是生成復雜報告。英偉達的模型提供了這種靈活性，并且具有頂級的性能，使其成為各行業企業的有力競爭選項。

然而，隨著這些強大的技術的推出，也伴隨著責任。如同任何人工智能系統一樣，Llama-3.1-Nemotron-70B-Instruct也無法避免風險。英偉達已提醒用戶，該模型并未針對數學或法律推理等專業領域進行調優，這些領域對準確性要求至關重要。企業需要確保合理使用該模型，并采取必要的保障措施以防止錯誤或濫用。