微軟公開AI基礎(chǔ)設(shè)施服務(wù) 代號(hào):Singularity
微軟Azure和研究院團(tuán)隊(duì)正在合作開發(fā)一項(xiàng)新的AI基礎(chǔ)設(shè)施服務(wù),代號(hào)為“Singularity”。根據(jù)微軟發(fā)布的部分招聘內(nèi)容來看,Singularity團(tuán)隊(duì)正在努力構(gòu)建微軟所謂“全新的人工智能平臺(tái)服務(wù),將成為微軟內(nèi)部和外部人工智能的主要驅(qū)動(dòng)力”。
該項(xiàng)目的成員發(fā)表了一篇題為“Singularity: Planet-Scale, Preemptible and Elastic Scheduling of AI Workloads”的論文,其中提供了關(guān)于Singularity項(xiàng)目的技術(shù)細(xì)節(jié)。Singularity服務(wù)旨在為數(shù)據(jù)科學(xué)家和AI從業(yè)者提供了一種方法,讓他們可以在微軟專為AI打造的分布式基礎(chǔ)設(shè)施服務(wù)上構(gòu)建、擴(kuò)展、試驗(yàn)和迭代他們的模型。
這篇最近發(fā)布的發(fā)表論文,作者名單中包括Azure首席技術(shù)官M(fèi)ark Russinovich;合作伙伴架構(gòu)師Rimma Nehme,曾在Azure Cosmos DB工作,直到2019年轉(zhuǎn)到Azure從事AI和深度學(xué)習(xí)方面的工作;以及技術(shù)研究員Dharma Shukla。根據(jù)這篇論文:
“Singularity的核心是一個(gè)新穎的、工作負(fù)載感知的調(diào)度程序,可以透明地提前搶占和彈性擴(kuò)展深度學(xué)習(xí)工作負(fù)載,在不影響正確性或者性能水平的情況下,在全局加速器(例如GPU、FPGA)中提高利用率?!?/p>
微軟方面此前曾討論過將FPGA作為服務(wù)提供給客戶的計(jì)劃。2018年微軟公開了代號(hào)“Project Brainwave”的項(xiàng)目,該項(xiàng)目旨在通過Azure提供快速AI處理能力。當(dāng)時(shí),微軟預(yù)覽了一個(gè)由Brainwave支持的Azure Machine Learning Hardware Accelerated Models,這也是微軟在為客戶提供用于AI工作負(fù)載的FPGA處理能力方面邁出的第一步。
我猜測(cè),Singularity是微軟把Brainwave轉(zhuǎn)化為商業(yè)服務(wù)邁出的下一步,我已經(jīng)向微軟方面提出詢問對(duì)此發(fā)表評(píng)論。我還詢問過微軟計(jì)劃何時(shí)以及如何將Singularity轉(zhuǎn)化為商業(yè)服務(wù)。
2019年,微軟宣布在OpenAI上投資10億美元,一年后微軟宣布,已經(jīng)與OpenAI合作并專門為OpenAI打造了全球第五大超級(jí)計(jì)算機(jī)。
雖然這款A(yù)I超級(jí)計(jì)算機(jī)是微軟專為OpenAI打造的,但微軟一直表示,將會(huì)通過Azure AI服務(wù)和GitHub提供微軟大型AI模型和訓(xùn)練優(yōu)化工具。此外微軟還通過Azure AI為那些不需要專用超級(jí)計(jì)算機(jī)的客戶提供各種加速器和服務(wù)。2021年11月,微軟宣布將在Azure 中采用80GB NVIDIA A100 GPU擴(kuò)展他們的AI超級(jí)計(jì)算機(jī)陣容。
大家可能還記得,此前微軟曾把Singularity用作另一個(gè)研究項(xiàng)目的代號(hào),當(dāng)時(shí)這是一個(gè)微內(nèi)核操作系統(tǒng)以及一組完全以托管代碼開發(fā)的相關(guān)工具和庫。這個(gè)Singularity并非基于Windows,而是作為概念驗(yàn)證從零開始編寫的。Singularity最終催生以及/或者影響了微軟其他幾個(gè)操作系統(tǒng)研究項(xiàng)目,包括Barrelfish、Helios、Midori和Drawbridge。
另外值得注意的是,微軟并不是唯一一家試圖在自己內(nèi)部和客戶之間提供人工智能超級(jí)計(jì)算功能的科技公司。Meta也在做同樣的事情,并且已經(jīng)將其作為解鎖元宇宙的一把鑰匙。