微軟CEO開年演講:預訓練Scaling Law依然偉大!首個英偉達GB200集群已上線! 原創
編輯|伊風
出品 | 51CTO技術棧(微信號:blog51cto)
剛剛,納德拉在CEOMicrosoft India進行了一場新年的第一場演講!
作為開年重磅,這場演講可謂干貨滿滿。
納德拉開門見山地說,“在某種程度上,對我來說,微軟始終專注于兩件事:我們是一家平臺公司,也是一家合作伙伴公司。即使在AI時代,這一點也不會改變。”
這場在印度班加羅爾的演講,聚焦在微軟將如何在AI時代進行平臺化的布局。
談論到這次AI帶來的巨變,納德拉還感慨地回憶了比爾蓋茨對微軟的影響?!懊慨斦務摰狡脚_變革時,我們必須了解推動平臺變革的基礎力量是什么?;仡櫸?5年的科技生涯,這個基礎力量一直是摩爾定律。我經?;貞浧穑葼柮磕陼偌覀儯屛覀兛茨柖傻内厔莺痛鎯夹g的發展,然后簡單地說:“用軟件填滿它。”這就是對整個公司的唯一指示。而這種情況即使到今天依然適用?!?/p>
話不多說,先給演講畫個重點:
- 納德拉提到雖然“預訓練的擴展定律能否繼續下去的爭論仍在持續”,但他堅信Scaling Law依然有效,只是會面臨更多挑戰。如何在預訓練中,更有效地利用采樣步驟是一個關鍵。
- 推動軟件界面變革的有三個關鍵因素:多模態能力,計劃和推理能力,擴展模型外的記憶、工具使用和權限管理。
- 作為一家平臺公司,微軟圍繞AI正在構建三大平臺:Copilot、Copilot AI 堆棧,以及 Copilot 設備。
- Copilot 將無縫內嵌到現有的工作流中。此外,微軟致力打造能構建Agents的無代碼工具,未來每個人都會根據工作需要自己搭Agents,就像現在做張Excel那么簡單。
- 納德拉談到了AI基礎設施,并提到了一個衡量公式——“簡單來說,衡量任何國家或企業的成長效率將取決于“每瓦特、每美元對應的 Token 數量”。未來兩年、五年甚至十年,我們會看到這種公式與 GDP 增長直接相關?!?/li>
- 微軟與 Nvidia 合作的首個GB 200 集群,在演講當日(1月7日)已經完成上線。
以下是經整理的演講全程,enjoy:
1.Scaling Law非常偉大,預訓練仍將繼續
當我們談論支持AI發展的擴展定律時,摩爾定律再次在發揮作用。
這始于2010年的深度神經網絡(DNNs),后來GPU再次推動了這一趨勢,尤其是變壓器模型的使用,因為數據并行處理的效率提高了。數據容量的增長速度從每18個月翻倍變成了每6個月翻倍,這就是擴展定律的力量。
當然,現在關于預訓練的擴展定律能否繼續下去的爭論仍在持續。我們堅信這些擴展定律依然有效,
但隨著數據規模、參數數量和系統問題的增大,挑戰也越來越大。
更有趣的是,推理時間或測試時間計算的擴展定律正在變得越來越重要。在某種程度上,預訓練有一個采樣步驟,而這關乎如何更有效地利用采樣步驟。我們現在非常興奮的是,將這種能力提升到新水平的機會,尤其是在推理過程中。
2.改變軟件界面的三大關鍵
現在,有三大關鍵能力正在改變軟件界面:
首先是多模態能力。
我最近將iPhone上的“操作按鈕”設置為調用Copilot,現在我可以自信地用海得拉巴方言或烏爾都語對它說話,它能理解我,就像在和我的高中朋友聊天。這個簡單而熟悉的界面將改變所有軟件類別。
其次是計劃和推理能力。
例如在GitHub Copilot工作區中,它可以執行計劃和執行多步流程的能力。
第三是擴展模型外的記憶、工具使用和權限管理。
未來12個月,開發者的重點將是如何讓模型了解可用工具,不僅限于函數調用,還要確保它理解權限和擁有長期記憶。這將幫助我們創造豐富的智能Agents生態。
當我們思考Agents時,它涉及將多模態能力、計劃和推理、記憶以及工具的使用,尤其是授權,整合在一起。這樣,我們可以開始構建個人Agents、團隊Agents、企業級Agents和跨企業Agents。這種“智能體化”的世界是我們期待共同構建的方向。
平臺賦能:Copilot、Copilot AI 堆棧、 Copilot 設備
當然,對于微軟來說,我們從來不會只關注單一的技術。我們關注的是如何通過這些技術手段,賦能地球上每個人和每個組織,讓他們實現更多目標。這種平臺所能帶來的賦能感,將會達到全新的高度。
這就是我們真正專注的領域。為此,我們正在構建三大平臺:Copilot、Copilot AI 堆棧,以及 Copilot 設備。接下來,我想概述一下這些平臺的主要內容。
圖片
Copilot嵌入工作流,每個人都能創建Agents
把 Copilot 想象成 AI 的用戶界面 (UI)。即使在一個豐富的化世界中,AI 仍然需要與我們互動,而這種互動需要一個 UI 層。因此,Copilot 作為一個組織層在這個充滿自主Agents的世界里變得至關重要。
我們采用的策略是將 Copilot 內嵌到現有的工作流中。
我見過的一個最好的例子是關于知識工作中最重要的場景之一。
例如,一個醫生正在為腫瘤委員會會議做準備。這樣的會議非常關鍵,意味著她需要閱讀所有報告,并準確分配每個病例的討論時間。因此,議程的創建本身就是一個推理任務,AI 會生成一個議程,標明哪些病例更復雜,需要更多時間。
然后,醫生們會在 Teams 會議中討論這些病例,他們可以專注于討論而無需記筆記,因為 AI 會記錄所有詳細內容。結束后,這位醫生還是一位老師,她希望將討論內容用于教學。她可以將筆記轉成 Word 文檔,再轉成 PowerPoint,用于課堂上。這種簡單但高影響力的工作流,通過將 AI 嵌入到流程中得以實現。
這展示了 AI 如何融入現有工作流的一個例子。
接下來,通過 Pages 和 Chat、Web 和 Work Scope,我們將看到新的工作流形式。
現在,我可以通過一個查詢訪問來自 Web 或 Microsoft 365 圖中的信息,并將這些信息提升到一個名為 Pages 的交互式 AI 優先畫布中。在 Pages 中,我可以直接使用 Copilot 進行修改。這是與 AI 一起思考、與同事協作的新方式。Chat 和 Pages 將成為新的 AI 中心,就像 Word、Excel 和 PowerPoint 過去改變了我們的工作方式一樣。
但我們并沒有止步于此。接下來,我們要關注的是擴展性。
AI 的擴展從 Copilot Actions 開始。就像過去在 Outlook 中使用規則一樣,現在可以為 AI 創建規則,但這些規則不是針對單一應用,而是貫穿整個 Microsoft 365 系統。這就是 Actions 的強大之處。我們的很多工作流都涉及信息的收集與分發、連接人與信息,這些都可以通過 Copilot Actions 輕松實現。
當然,我們還可以構建完整的Agents。我們自己也開發了許多范圍不同的Agents,比如團隊級、流程級的Agents。
圖片
一個典型的例子是 Teams 中的Agents,可以擔任翻譯或協調員角色,就像團隊中的新成員,幫助完成任務。SharePoint 現在也有了內置Agents,它能智能地分析文檔,增強知識分享。我們可以通過簡單操作或 Copilot Studio 定制這些Agents,并在 Teams 聊天中共享。
下一個是“協調員Agents”,它能在會議中管理議程、實時記錄筆記和任務,讓團隊專注于討論。此外,它還能通過實時總結和回復問題來簡化聊天中的溝通。而“翻譯Agents”則消除了語言障礙,實現了實時語音翻譯,使每個人都能自由交流。
項目管理Agents能夠創建項目計劃、分配任務,甚至代表團隊完成任務,從而確保每個人都了解情況并有效協作。最后,在HR和IT等專業業務流程中,新的員工自助服務Agents在Copilot Business Chat中提供,讓員工可以即時獲得答案并執行操作,如提交服務臺工單。這些Agents可以通過Copilot Studio自定義,利用預建的工作流和更多功能。全新的AI和Microsoft 365正在提升生產力,徹底重新定義工作方式。
以上是我們在系統中構建的Agents示例。但真正令人興奮的是,你們也可以構建Agents。這正是Copilot Studio的用武之地。
我們對Copilot Studio的愿景很簡單:這是一個為構建Agents而設計的低代碼/無代碼工具??梢灶惐菶xcel——人們可以輕松制作電子表格,而構建Agents應該同樣簡單。Copilot Studio旨在幫助每個人掌控自己的工作流程,以支持我們在知識工作中的實際需求。它就像一個“Agents群”,圍繞我們的日常工作提供幫助,減少重復性任務,提升工作流暢性。例如,對于現場服務,只需輸入提示和說明來定義Agents的任務,然后將其與SharePoint中的知識源連接,它就可以自動生成Agents。
這種無需編碼就能輕松創建Agents的能力,正是Copilot Studio的核心?,F在,你擁有了AI的用戶界面、可擴展性功能、內置Agents和自定義Agents的構建能力,這形成了一個完整的系統。
接下來就是投資回報率(ROI)和衡量標準的問題。這是另一個關鍵問題:我們如何確保這些技術能帶來實質性的動機變化?最終,這些工具不僅應提高個人生產力,還應改善組織的業務成果。我們正在開發Copilot Analytics,讓銷售經理等用戶能夠關聯銷售增長、產出提升等指標與Copilot功能的使用,從而實現實時反饋和優化業務結果。
演講圖:使用Copilot帶來的業務成果趨勢
這種方式加速了AI應用的推廣周期,不需要等待多年即可看到成效。Copilot作為AI用戶界面,具備擴展性和測量功能,已經成為我們構建的首個平臺。
我們在微軟內部已經看到顯著成效,各種業務流程如客戶服務、人力資源自助服務、IT運維、財務、供應鏈和營銷都實現了雙位數的生產力提升。例如,在營銷中,從購買決策到內容創作存在許多低效環節,而AI帶來了巨大的操作杠桿。
這種擴散速度之快,在全球范圍內已經超越了過去需要多年才能普及的模式。在印度,我見證了許多大規模部署的實例。例如,今天上午我與Cognizant的團隊交流,他們已將AI技術全面推廣給員工。
英特爾前CEO安迪·格魯夫在90年代提出過“知識轉換”概念,即快速創建和傳播知識的重要性。這與零售供應鏈轉換類似,只是應用于知識產業。Persistent公司是另一個例子,他們開發了一種合同管理Agents,可以在Copilot中使用,并貫穿整個合同生命周期處理重大變更。這是企業大規模部署Copilot系統的又一實例。
四、Copilot AI 堆棧:AI 并不是獨立存在的,它需要整個計算堆棧的支持
接下來我想談談下一代平臺——Copilot 堆棧和 AI 平臺。對我們來說,Azure 一直被構想并建設為“世界的計算機”。我們始終對其充滿承諾,因為我們意識到 AI 并不是獨立存在的,它需要整個計算堆棧的支持,因此我們正在全球范圍內構建這一體系。
基礎設施
我們在全球擁有超過 60 個區域,300 多個數據中心。在印度,我們對現有的區域擴展非常興奮,包括中央印度、南印度和西印度區域。同時,我們還與 Geo 合作增強了容量。今天,我很高興宣布我們在印度進行的史上最大規模的擴展,將投入 30 億美元來增加 Azure 的容量。
圖片
昨天我有機會會見了莫迪總理,體驗非常棒。他分享了許多例子和愿景,特別是他推動 AI 使命的戰略。這個愿景結合了“印度堆?!保↖ndia Stack)、這個國家的創業活力,以及消費者和企業端的人口紅利,形成了一個良性循環。因此,我們非常看好引入下一代 AI 核心計算能力。
當談到基礎設施時,我們引入了一個新公式——簡單來說,衡量任何國家或企業的成長效率將取決于“每瓦特、每美元對應的 Token 數量”。未來兩年、五年甚至十年,我們會看到這種公式與 GDP 增長直接相關。因此,基礎設施必須成為最高優先級。
我們在各個層面進行創新。從優化液冷 AI 加速器的建設,到可再生能源基礎設施的合作,實現 0 廢物、0 水資源使用,再到整套系統的協同建設。
接著是硅片創新。我們與 Nvidia 合作,今天已有首個 GB 200 集群上線。同時,我們還與 AMD 合作,開發 Maya 芯片,Maya 已經在 Microsoft.com 處理大量客戶服務流量。這些投資使我們構建了世界一流的 AI 加速器基礎設施,優化訓練、推理內核,推動全系統級的創新。
數據層
基礎設施就緒后,接下來的大問題是數據治理。今天我與許多客戶和合作伙伴交流,他們首先關心的是如何整理數據。
數據是構建 AI 的唯一方式,不僅用于預訓練,還用于 RAG(檢索增強生成)需要的數據、后期訓練、采樣和推理計算。因此,首要任務是將數據與云端對接。我們正在構建數據資產管理體系,無論是 Snowflake、Databricks、Oracle 還是 SQL,都可以遷移到云端,全面支持 AI 計算。
我們擁有為AI應用設計的出色操作性數據存儲系統,無論是Cosmos DB還是用于分析型工作負載的SQL Hyperscale或Fabric,它們都已準備好支持AI。實際上,ChatGPT的一些最大用戶就依賴于Cosmos DB,因為它是用于存儲ChatGPT用戶狀態的有狀態應用的數據庫。
因此,我認為數據層非常重要,我們正在盡一切努力確保能夠幫助大家整理數據,以便結合這些模型使用和構建模型。這包括基于數據進行模型訓練,還包括使用數據進行諸如檢索增強生成(RAG)等操作。所以數據重力的就近性至關重要,數據的本地化處理也至關重要。
AI應用服務器Foundry
在擁有基礎設施和數據之后,第三步是創建AI應用服務器?;仡櫄v史,當網絡興起時,我們構建了IIS應用服務器;當云計算崛起時,我們開發了云原生應用服務器;移動時代也是如此。因此,每一代技術都需要一個應用服務器,而我們現在正在構建Foundry。
圖片
Foundry的核心是模型,尤其是OpenAI的創新成果。我們對GPT-4和即將到來的新版本感到興奮,同時也整合了來自開源社區的模型,如Llama和Mistral。此外,還有針對特定行業和印度本地語言需求開發的模型。我們希望擁有最豐富的模型目錄,其中一些流行模型將作為服務通過API接口提供。
獲得模型后,我們需要部署、微調、蒸餾、評估模型,還需要進行可靠性和安全性測試。為了簡化這些操作,我們將其整合到應用服務器中。模型評估將變得至關重要,我的團隊始終關注前沿模型,并確保應用服務器層具有靈活性,以便快速適應新模型。這個過程包括樣本測試、成本和延遲優化,以及為特定用例進行微調,這就是Foundry的目標——簡化整個流程并推動巨大進步。
在印度,我看到了許多客戶已經開始部署AI技術并提供了寶貴的反饋。例如,多Agents部署的嘗試讓我們學到了很多。展望未來,我認為行業的重點將從“模型”轉向“模型編排”和“模型評估”,并如何部署“面向未來的應用”,這是未來的重要趨勢。
今天,我見到了巴羅達銀行的團隊,他們展示了三個Agents:一個自助服務Agents,一個為新客戶提供服務的關系經理Agents,還有一個面向員工的Agents。此外,我參觀了一家名為ClearTax的初創公司,它的稅務處理流程簡單到只需用WhatsApp提交收據,然后就能獲得退稅。我特別喜歡這一點。此外,我還與ICICI Lombard團隊交流,了解到印度的醫療理賠表單沒有標準化,需要手動讀取。這種效率的提升將直接促進經濟增長,因為確保理賠順利意味著保險服務得到了保障。
圖片
我還見到了MakeMyTrip團隊,他們的高目標是將旅行行業中的復雜流程(包括酒店、航班和其他交通工具)通過多Agents框架實現自動化。不僅大型公司和初創企業在推動這項技術,其在印度的普及速度同樣令人興奮。最后,我想請大家觀看合作伙伴的視頻展示。
在印度,我們生產了大量的主要農作物,如甘蔗、小麥、水稻、豆類和棉花。但與其他發達國家相比,我們的產量仍然很低。土壤侵蝕是印度當前的主要問題,這主要是由于農藥的使用。
巴拉馬提合作社已經為農業社區服務了五十多年。他們的努力幫助資源貧乏的農民改善了生活。AgriPinado AI幫助農民避免猜測,通過科學的方式獲取真實數據,從而做出明智的決策并取得成功。在這個項目中,我們從馬哈拉施特拉邦選擇了1000名先進的農民,為他們安裝了氣象站、土壤傳感器,并提供了衛星支持。每天我們都從土壤中收集實時數據,AgriPinado AI使用Microsoft FarmBeats管理農業數據,通過運行超過20種算法來基于歷史模式提供準確的結果。
Azure OpenAI讓農民能夠用本地語言在WhatsApp上提問,從而在田間精準地使用灌溉、化肥和農藥。
對我而言,這真正實現了各種技術的整合。從Azure IoT的連接,到數據平面的處理,再到使用Azure AI,最終的目標是讓農民能夠提高產量。這些技術的整合展示了科技的力量和我們可以實現的成就。
工具
現在,最后一層是工具。如果你有了基礎設施、數據和AI,工具就變得至關重要。微軟起步于工具公司,我們始終對工具充滿熱情,尤其是通過GitHub。
在印度,現在有1700萬GitHub用戶,是僅次于美國的第二大社區。實際上,到2028年,印度的開發者數量將超過美國,這令人興奮。此外,印度的開發者對AI項目的貢獻也僅次于美國,社區的活躍度和才華令人振奮。我們在GitHub Copilot上的進展同樣令人興奮。
我們現在已經實現了多文件編輯功能。從連續代碼補全到聊天功能,再到多文件編輯,這使得可以對整個代碼庫進行修改。我們還推出了免費的GitHub Copilot層級,這一功能在印度發展迅速?;仡?020年,我第一次看到GitHub Copilot,那時我深信LLM的潛力。隨后,我看到GitHub Copilot Workspace,這是超越聊天功能邁向真實Agents的一步,它讓開發者可以從GitHub問題生成規格書、編輯計劃、執行整個代碼庫的操作。
今天,我邀請了我的同事Karen Napa來展示這些功能。Copilot Workspace是一個AI原生開發平臺,可以將你的想法通過自然語言直接轉化為代碼。接下來,我們將展示如何用Copilot Workspace為一個在線銷售運動器材的應用程序添加管理頁面功能。
你知道嗎,看到開發工具鏈的進展真的很令人興奮。事實上,直到今天,Copilot Workspace不再有等待名單了,我們對此感到非常興奮。對我個人而言,也許最大的改變就是Windows 365,我有了我的桌面,加上GitHub Copilot和Copilot Workspace,還有Code Spaces。將這些工具結合起來,無論我身處世界的哪個角落,我都是個快樂的人。這真是一個改變開發生產力的奇妙進步。
五、Copilot 設備:最快、最智能的Windows PC
那么我最后想談談的是Copilot設備。我們討論了這么多創新和基礎設施,從云端的硅開始,現在它正在走向邊緣。
我們非常興奮與高通、AMD、英特爾在NPUs方面的合作。事實上,今天,Jensen甚至談到了即將進入常規PC的下一代GPU,這些GPU將能夠在本地運行整個Nvidia技術棧。所以我們對這些Copilot設備以及更廣泛的Copilot PC,甚至是帶有GPU的傳統PC發生的變化感到非常興奮。但我們也對基礎工作充滿期待,對吧?當我使用我的Copilot PC時,能夠保證電池續航整天使用,擁有內置的新AI功能,第三方開發者也開始使用它,無論是Adobe、Cap Cart還是其他公司。所以這真的是一個新的平臺的開始,它將在邊緣發生的事情,和云端一樣令人興奮。
實際上,我們不把它看作是舊的客戶端-服務器模式。這不僅僅是關于離線本地模型,而是關于混合AI。
現在的思路是,你可以構建應用程序,讓你能夠將一些工作卸載到本地NPU上作為輔助,進行分類處理,同時調用云端的LLDs。任何應用程序都將真正成為一個混合型應用程序。這不是僅僅在本地運行,或者完全在云端運行。我認為這就是我們一直期待的。讓我們播放一個視頻,讓大家了解一下Copilot設備上的一切。
為了真正確保這三個平臺能夠廣泛分發和使用,關鍵的考慮因素是信任。
關于安全性、隱私和AI安全的信任。所以我們有一套原則,但更重要的是,這些原則和舉措是基于真正的工程進展,確保我們能夠在整個過程中有效地建立信任。比如說,像安全性這樣的東西,如何防范敵對攻擊,比如提示注入?我們正在構建的一項關鍵內容。再比如AI中的隱私問題,如何思考機密計算,不僅僅是針對PC,而是針對GPU?這是我們現在和每個人合作的內容,無論是Nvidia、Intel,還是AI安全方面,很多人談論的一個大問題是幻覺。
我們如何確?;A性?所以,帶有評估支持的基礎服務是我們在AI安全方面取得實際進展的一種方式。所以我們真正把信任作為一項首要的工程考慮,設定了一套原則,但更重要的是將這些原則轉化為工具鏈和運行時,允許我們作為開發人員構建更值得信賴的AI。
現在,我想從我開始的地方結束,那就是我們的使命是賦能每個人。但在我去那之前,我想談談的是,這一切都涉及到做AI商業轉型,對吧?最終,它是關于改變客戶服務,或者改變你的營銷、銷售,或是內部運營。歸根結底,最終是關于商業成果。
我想提交的三個考慮因素是,Copilot作為AI的UI,它是確保你能夠確保把應用服務器作為構建AI應用的平臺,在我們看來就是Foundry,另一個是你的數據,與Fabric結合。因此,這三者可能是需要做出的三大關鍵設計決策,而不是任何給定的模型,因為模型每年都會變化,每個月你都會有新的模型,但這三大基礎設計選擇才是真正的關鍵,那就是UI層是什么,你的Agents如何與UI層接口,你如何思考你的數據,以及你如何思考應用服務器,實際上它給你提供了基于模型的敏捷性。
這三者是你應該從我們在平臺上所做的工作中得到的希望,通過這些,我們的使命是賦能印度每個人、每個組織,這驅動著我們。最終,它是確保這個國家的人力資本能夠繼續擴大,利用這項技術所帶來的巨大機會和潛力。因此,我今天非常興奮地宣布,我們一直以來的承諾,現在是到2030年培訓1000萬印度人AI技能。對我來說,最重要的事情是,不要把技能培訓看作抽象的,而是看到這些技能如何轉化為實際影響,一次一個社區,一次一個行業。所以我留下一個視頻,展示所有技能培訓已經在印度產生的影響。非常感謝大家,謝謝你們在平臺上做出的出色工作,謝謝。
本文轉載自??51CTO技術棧??,作者:伊風
