微軟如何看待其“模型即服務”功能使AI普及化
如今的工具使構建AI驅(qū)動的應用程序變得容易,但一個復雜的領域是,幾乎所有開發(fā)人員都希望避免處理如何托管所使用的模型,這不僅是選擇OpenAI的GPT-4o、Meta的Llama 3、Google的Gemini或市場上眾多開源模型的問題,更是部署它們的問題。
這種必要但令人頭疼的工作可能會讓開發(fā)人員感到沮喪,消弱他們的動力,然而,微軟有一個解決方案,可以讓他們更專注于創(chuàng)意過程,而不是模型的維護,這個叫做“模型即服務”(Models-as-a-Service,簡稱MaaS)的解決方案,相當于云服務的AI版本,按訪問收費而不是基礎設施費用,并通過公司的AI Azure Studio產(chǎn)品提供。
保持簡單
“如果你曾經(jīng)嘗試部署模型,你會發(fā)現(xiàn)有一系列的組合,包括化身、Pytorch版本、CPU和GPU等等,”微軟AI平臺的首席項目經(jīng)理Seth Juarez告訴記者。“模型即服務可以抽象掉所有這些,如果你有一個想要使用的模型,無論是開源的還是OpenAI構建的,我們都會在目錄中提供。你按下一個按鈕,就可以使用它的端點了。”
開發(fā)人員可以通過按需付費計劃租用推理API并托管微調(diào)——所有這些都不需要使用虛擬機。Juarez解釋說,雖然微軟有超過1600個模型可以執(zhí)行各種功能,但它也希望讓開發(fā)人員更容易地將AI功能融入他們的軟件中,MaaS就是實現(xiàn)這一目標的方式。
從2023年起,微軟通過這個項目提供了一些精選的模型。最初,Mistral-7B和Meta的Llama 2是可用的。本周,它添加了Nixtla的TimeGen-1和Core42 JAIS,并表示AI21、Bria AI、Gretel Labs、NTT Data、Stability AI和Cohere的模型即將推出,這只是AI Azure Studio上可用內(nèi)容的一小部分,那么如何成為一個MaaS模型呢?
一些模型是公司合作的結果,Juarez承認他不知道這些是如何發(fā)生的。其他模型被支持是因為一些API工作使這些模型的功能簽名足夠統(tǒng)一,可以成為模型即服務的一部分。有一種統(tǒng)一訪問這些模型的方法。不幸的是,更專業(yè)的模型不符合條件,必須以其他方式部署。“這就是為什么你會看到一些模型啟用為模型即服務,而其他你可以推送到自己的容器中運行,我們稱之為托管推理,”他說。
“租”或“擁有”你的模型
他相信未來我們會看到一種分化模式,開發(fā)人員將選擇模型的方式類似于房主或租房者。“基本上,你擁有容器、模型和Azure ML,你支付租金并進行維護,”Juarez表示,“在模型即服務中,我們進行維護。我們點亮的模型越多,如果你想租用,那很好,但還有其他人特別喜歡虛擬網(wǎng)絡,需要在其上運行東西。”
MaaS并不是一個獨特的模式,但是什么使AI成為最突出的技術,以復制云計算業(yè)務?Juarez認為現(xiàn)狀已經(jīng)顛倒——科技公司不再推出他們認為我們需要的技術。現(xiàn)在,我們正在向科技公司需求功能和服務,這要歸功于AI研究和商業(yè)化幾乎同步進行。“至少在我看來,這就是為什么你會看到這種奇怪的倒置,消費者通過使用ChatGPT的數(shù)量在要求這種體驗。現(xiàn)在,企業(yè)正試圖趕上……用戶今天想要研究的體驗。”