真·硬核! Build 2020: 自研超算挑戰全球 Top5,最大語言模型將開源
有史以來第一次,微軟 Build 大會選擇在線上召開。
盡管如此,對待今年的 Build 2020 大會,微軟依然誠意滿滿。
比肩全球 Top 5 的 AI 超級計算機,Windows 應用生態 UI 和 API 大統一,Edge 瀏覽器多項功能更新,Microsoft Teams 大升級、諸多基于 Azure 云計算的功能更新……
這一連串的產品發布或升級,讓今年的 Build 大會看點頗多。
更重要的是,作為本次大會最為重磅的環節,本次 Build 大會的 Keynote 開場,充分展示了這家巨頭對未來科技發展趨勢的洞察和判斷,并且也能夠讓人更加清晰地看到微軟在 Azure 云計算、Windows 生態、超級計算、AI 等領域的未來發展思路。
這是一場硬核的開發者大會。
北京時間 5 月 19 日晚間 11 點,本次 Build 大會正式開始。
在二十分鐘的暖場環節之后,大會首先迎來的是微軟 CEO Satya Nadella 的演講。
他首先談到了世界各地的開發者如何在新冠肺炎疫情中通過開發工作助力人們的生活,并再次強調了微軟的整體戰略。
Satya Nadella 表示,開發者對微軟非常重要,而微軟也已經為之打造了以 GitHub、Visual Studio 和 Azure 為主的工具鏈條。
由此,Satya Nadella 公布了一些成績,比如說:
-
Power 平臺擁有超過 350 萬個開發者;
-
Azure 已經被 95% 的世界 500 強公司所采用,并強調 Azure 是全世界的計算機(The World's Computer);
-
Windows 10 活躍用戶已經超過 10 億;
-
Microsoft Teams 企業用戶在過去兩個月增加了 3 倍。
最后,Satya Nadella 還通過兩個互動性案例展示了在新冠肺炎疫情下人們遠程合作解決問題、甚至是遠程合奏音樂的可能性。
隨后環節中,微軟開始了 Build 大會最為核心的產品更新發布過程,具體內容介紹如下。
微軟 AI 超級計算機來襲,比肩全球前五
2019 年 7 月 22 日,微軟宣布與 OpenAI 合作構建新的 Azure AI 超級計算技術。如今,這一合作迎來了新的里程碑——AI 超級計算機。
在 Build 2020 大會上,微軟宣布了堪比世界 Top 5 的 AI 超級計算機,它用于訓練超大型人工智能模型。微軟官方表示,該計算機是與 OpenAI 聯合構建的,專為訓練 OpenAI 的 AI 模型而設計。這將使下一代超大型 AI 模型和訓練這一模型所需的架構成為可供其他機構和開發人員開發的平臺——當然,這只是第一步。
這個超級計算機是單個系統,它擁有超過 285000 個 CPU 內核、10000 個 GPU 和 400Gbps 的網絡連接。微軟表示,與世界 TOP500 超級計算機相比,它居于 Top 5 之列。
在 Azure 中,這個超級計算機還受益于現代云架構的所有功能,包括快速部署、可持續的數據中心和對 Azure 服務的訪問。
OpenAI 首席執行官 Sam Altman 表示:
隨著我們越來越多地了解到我們所需和組成超級計算機所有組件的不同限制,我們發現,一旦有人能設計出夢想中的系統,微軟就能把它構造出來。OpenAI 的目標不僅在于追求研究上的突破,也在于設計和開發其他人可以使用的強大 AI 技術。與微軟合作開發的超級計算機旨在加速這一周期。我們看到,更大型的系統是訓練更強大模型的重要組成部分。
微軟還發布了一個新版本 DeepSpeed,即一個 PyTorch 的開源深度學習庫,它減少了大型分布式模型訓練所需的計算能力。 與三個月前發布的版本相比,此次的效率要高得多,現在人們可以在同樣的架構上訓練比此前大 15 倍以上、快 10 倍以上的模型。
此外,微軟宣布已經增加了對 ONNX Runtime 分布式培訓的支持。ONNX Runtime 是一個開源庫,旨在使模型在硬件和操作系統之間移植。
Project Reunion:Windows 應用生態大統一
2020 年 3 月,Windows 10 實現了一個重要的里程碑:其活躍用戶超過 10 億。根據微軟官方數據,人們每月花在 Windows 10 上的時間超過 4 萬億分鐘,用于工作、學習和連接——同比增長 75%。
由此,微軟在本次 Build 大會上推出了 Project Reunion。
Project Reunion 旨在統一 Windows 應用生態平臺,并使開發人員擺脫操作系統的限制,輕松地跨 Win32 和 UWP API 集成。
此前,微軟一直在 Windows 平臺上推動 Win32 程序 API 和 UWP API 的融合,但二者之間一直存在障礙。而 Project Reunion 將統一對現有 Win32 和 UWP 的訪問,并通過 NuGet 等工具使它們在與脫離操作系統的情況下可用。
也就是說,這將為新應用程序提供一個通用平臺。另外,它將幫助 Windows 開發者更新現有的應用程序并使之具有最新的功能,無論它們是 C++、.NET(包括 WPF、Windows 和 UWP)或 React Native( Facebook 于 2015 年 4 月開源的跨平臺移動應用開發框架)。
不僅如此,在分離現有的 API 并添加新的 API 時,微軟也在根據需要進行 Polyfill(一個解決兼容問題的開發方案) 操作,因此 API 在支持的 Windows 版本中實現向下兼容。
基于 Project Reunion,微軟率先推出了一個全新的 UI 框架:WinUI 3 Preview 1。
WinUI 3 Preview 1 是用于 Windows 的現代化本地 UI 框架。WinUI 應用程序可以擁有適應和縮放設備的現代 UI,不管是否新建項目,或逐步升級現有的應用程序(包括 C++、WPF 和 Windows),都將可以擁有這個 UI。
除了 WinUI 3 Preview 1,微軟還將 WebView 2 進行擴展預覽,該預覽可以讓開發者在 Windows,WPF 和 UWP/ WinUI 3 應用程序中嵌入基于 Chromium 的 WebView,非常方便。
值得一提的是,微軟還正式面向企業用戶發布了 Windows Terminal 1.0。
微軟 Edge 瀏覽器更新
Edge 瀏覽器的更新是微軟 Build 大會的常備節目,今年也不例外。在本次 Build 2020 大會上,Edge 瀏覽器的更新不僅面向開發者和普通用戶群體,也選擇從公司客戶群體的角度切入。
具體的更新內容很有限,包括:
-
在 Windows 中可以更好地支持 PWA 應用;
-
改進 Microsoft Edge Add-ons 網站,便于開發人員進行搜索和查找擴展;
-
集成 Pinterest,使得 Edge 瀏覽器上的 Collections 將變得更加智能,不僅能夠看到相關 Pinterest 建議,還新增了發送至 One Note 的功能;
-
新增“側欄搜索”,能夠給以更快、更符合上下文的方式進行搜索查找;
-
數據保護增強,通過“自動切換配置文件”功能,Edge 瀏覽器對個人和公司數據進行分離,工作賬戶需要憑證登陸,不會與個人賬戶混淆。
-
Bing 搜索將全面變化,當用戶使用工作憑證登錄到 Bing 時,圖片、購物和新聞等內容將出現在其他熟悉的頁面旁邊。
總體來看,今年 Edge 瀏覽器面向普通用戶的更新不多,這也是因為它本身在功能上已經非常成熟;但在面向開發者和企業用戶方面,Edge 瀏覽器依然大有可為。
Azure Synapse Link 公開預覽發布
2019 年 11 月,微軟發布了 Azure Synapse Analytics,建立起企業數據倉庫和大數據分析。不過,操作數據與分析系統并無分開,這使得在事務性與分析性的處理需求不夠明晰。由此,在 Build 2020 上,微軟發布了一個新工具 Azure Synapse Link 的公開預覽。
這是 HTAP (Hybrid Transaction and Analytical Process,混合事務和分析處理,一種新型的應用程序框架,以打破 OLTP 和 OLAP 之間的隔閡,既可以應用于事務型數據庫場景,亦可以應用于分析型數據庫場景)的一個基于云端的實現。
Azure Synapse Link 能夠消除 Azure 操作數據庫服務和 Azure Synapse Analytics 之間的障礙,通過一次單擊,用戶就能夠從存儲在其操作數據庫中的實時交易數據中獲得見解,而無需管理數據移動或對其操作系統造成負擔。
目前,Azure Synapse Link 可以在 Azure Cosmos DB 中使用,未來將開放其他操作數據庫服務,包括 Azure SQL、用于 PostgreSQL 的 Azure 數據庫、用于 MySQL 的 Azure 數據庫等。
Azure Synapse Link 的基礎是微軟的云體系結構。客戶只需單擊他們最喜歡的 Azure 數據庫服務中的一個按鈕,就可以使用 Azure Synapse Analytics 建立到數據的直接鏈接。然后,操作數據自動且連續地以優化的柱狀結構提供給 Azure Synapse Analytics,類似于覆蓋索引。
Microsoft Teams 的新升級
Microsoft Teams 發布于 2016 年 11 月,它是微軟推出的 Office 系列應用 ,是一款基于聊天的智能團隊協作工具,集會議、電話、聊天和文檔共享、協作于一體。伴隨著今年疫情導致的遠程辦公趨勢,Microsoft Teams 也火了起來。
在本次 Build 大會上,Microsoft Teams 在生產力和自動化方面都有了新的升級。不僅如此,在會議、通知、遠程調度方面,通過與其它應用程序的集成,Teams 也煥發出新的一面,亮點如下:
-
生產力:用戶能夠使用可定制模板快速創建團隊,每個模板都帶有預先定義的通道、應用程序和指南。另外,基于 Power Virtual Agents 應用程序,用戶能夠更簡易地在團隊中創建和管理聊天機器人。
-
自動化:主要表現在 Power 平臺與 Teams 的集成和擴展上。通過 Power 平臺,用戶可以快速添加自定義應用程序和自動化工作流程到 Teams。另外,Power BI 的用戶能夠簡單快捷地將報告共享至 Teams。
-
會議:通過新應用程序 “Booking”,組織者能夠合理安排、管理、執行多個會議議程。
-
通知:微軟 Teams 引入了新的網絡設備接口(Network Device Interface,NDI)支持和 Skype TX 互操作性,為公共或私人定制的大規模廣播提供了一套產品選項。
-
遠程調度:這主要體現于 Shifts 工具上,其新增的 Power Automation Actions 使開發人員能夠從 Shifts 中獲取信息,與其他應用程序創建定制工作流或大量執行操作,以此來幫助優化流程、節省時間。
實際上,本次大會的媒體資料,正是通過 Microsoft Teams 工具提前發放的;可以想見的是,在遠程辦公越來越成為行業趨勢的情況下,Microsoft Teams 勢必會越來越受歡迎。
Fluid Framework 開源 + 升級
為了幫助團隊更好地進行協同創造,微軟在去年的 Build 大會上推出了 Fluid Framework(中文可稱之為:流體框架)。這是一個基于網頁的新型平臺,提供了組件化的文檔模型以共享互動體驗。
在本次 Build 大會上,微軟宣布 Fluid Framework 面向開發者開源。
不僅如此,微軟對 Fluid Framework 的協作形式進行了升級,旨在打破應用程序之間的障礙,實現無縫協作,此次更新主要體現在 Outlook 和 Office.com 中。值得一提的是,這也是 Fluid Framework 第一次在 Microsoft 365 中集成。
從 Outlook 層面來看,表格、圖表和任務列表可以插入到網頁版 Outlook 中,由此,用戶的銷售數據、項目任務和研究報告可以實時更新。
在 Office.com 中,用戶可以創建并管理 Fluid Framework 工作區,包括文檔活動提要、推薦列表等,或是在 Office.com 上進行搜索。
目前,Fluid Framework 的關鍵基礎設施已開源,基于 Web 的 Fluid Framework 可以使應用程序進行協作,包括執行低延遲同步的數據結構和連接端點的中繼服務。
Azure Machine Learning 新工具
在 Build 2020 大會上,微軟宣布了一些機器學習相關工具,可以幫助開發人員理解、保護和控制整個機器學習生命周期中的模型。這些工具可以通過 Azure Machine Learning 訪問,也可以在 GitHub 上的開放源碼中獲得。
在隱私方面,微軟發布了一個用于區分隱私的工具包——Whitnoise。Azure Machine Learning 還內置了控件,使開發人員能夠跟蹤和自動化構建、培訓和部署模型的整個過程。 這種被許多人稱為機器學習和操作(MLOp)的功能提供了審計跟蹤,以幫助組織滿足法規和合規要求。
史上最大語言模型 Turing-NLG 將開源
在 Build 開發者大會上,微軟宣布將很快開始開源微軟圖靈模型,以及在 Azure 機器學習中訓練它們的方法。因此開發人員能夠訪問微軟來提高其產品之間語言理解的一系列語言模型。
目前,用于自然語言生成(NLG)的微軟圖靈模型是世界上最大的公開可用的語言 AI 模型,具有 170 億個參數。這類新模型的學習與監督學習模型不同,它是采用“自我監督”學習。
在“自我監督”學習中,這一人工智能模型可以通過查看互聯網上數十億頁的公開文檔——維基百科條目、出版的書籍、指導手冊、歷史課、人力資源指南——來學習語言。在類似于瘋狂口訣的大型游戲中,單詞或句子被移除,該模型必須基于上下文來預測缺失的部分。
它也可精準識別語言、語法、知識、概念和語境的細微差別,無論是總結冗長的演講,還是在數千個法律文件中查找相關段落,都可以勝任。
由于這個模型已經重復過幾十億次上述游戲了,因此非常善于感知單詞之間的相互聯系,對語法、概念、語境和其他語言構成要素有著豐富的理解。它還允許相同的模型在許多不同的語言任務中傳遞培訓經驗,從文檔理解到回答問題、再到創建會話機器人。
同時,這一人工智能模型只需要接受大量數據和超級計算資源的一次訓練,然后針對不同任務對較小的數據集和資源進行微調。
微軟表示,它也在探索其他的大規模 AI 模型,這些模型可在文本、圖像和視頻中以一般化的方式學習。例如,這可以幫助在 Office 中自動為圖像添加字幕以方便訪問,或者通過了解圖像和視頻中的內容來改進人們使用 Bing 搜索引擎的方式。
微軟 CTO Kevin Scott 表示:
通過開發這種用于訓練大型人工智能模型的前沿架構,我們正在讓 Azure 變得更好。我們正在建設更好的計算機、更好的分布式系統、更好的網絡、更好的數據中心。這些都會推動整個 Azure 的性能、成本和靈活性變得更好。
面向醫療行業的云服務
在 Build 2020 大會上,微軟宣布了其首個針對特定行業的云服務——Microsoft Cloud for Healthcare(微軟云醫療服務),目前已公開預覽,并將在未來 6 個月免費試用。
Microsoft Cloud for Healthcare 不僅能夠助醫療保健組織以更主動的方式與患者互動,使護理人員能夠提高其工作流程的效率,還能夠擴展 Dynamics 365 營銷、Dynamics 365 客戶服務以及 Azure IoT 的價值。
基于此,護理團隊可以輕松創建針對患者就醫過程的增強分析;患者在看病時也可以實現在線預約、提醒、賬單支付等多種醫療任務,并且還能夠通過 IoT 持續監測患者,升級護理。
另外,在 Microsoft 365 和 Microsoft Teams 的功能構建中也包括了醫療服務,比如“Booking”應用程序,使醫療保健提供商能夠在團隊中安排、管理和進行“Microsoft 機密提供商到患者”的虛擬訪問。
在新冠疫情形勢依舊嚴峻的當下,Microsoft Cloud For Healthcare 的推出可以說是恰逢其時了。
雷鋒網總結
一場大會下來,微軟給人的感覺是:它離普通用戶越來越遠了。
的確,對微軟來說,Build 大會越來越變成了一個面向開發者和行業用戶的會議;而與普通用戶群體關聯更為密切的 Windows 10 和 Office 365,已經成為 Microsoft 365 的一個組成部分。
不得不承認,Windows 10 還不夠完善,它在本次 Build 大會上還有應用生態層面的更新;但 Windows 10 已經變成了整個微軟開發生態的一個軀殼,或者是一個容器,承載著微軟在 AI 和 Azure 云計算方面的用戶端口。
但也許正是因為如此,Build 大會才越來越彰顯它面向開發者的本質。
正如 Satya Nadella 所言,如今的微軟已處在 Intelligent Cloud & Intelligent Edge 的時代,也正處于全球各類企業面向數字化轉型的時代。在這樣的新時代,微軟越來越依賴眾多開發者的參與,從而在開源上著力甚多;而從產品上來說,以 Azure 和 Microsoft 365 等產品為載體,微軟將眾多前沿技術融入其中,從而賦能開發者。
總體來看,微軟越來越深入地走向它正在踐行的新任務,即幫助全球各種各樣的企業進行數字化轉型;當然,在這個過程中,微軟也正在實現自己面向未來的另一次轉型。
某種意義上,這也正是微軟自己的 Hit Refresh。