大到大模型,小到產(chǎn)品更名,一窺云計(jì)算一哥的創(chuàng)新哲學(xué)
亞馬遜云科技2024 re-Invent大會(huì)在拉斯維加斯落下帷幕,發(fā)布了相當(dāng)多讓人印象深刻的新產(chǎn)品。那么,我們?cè)撊绾卫斫夥N種發(fā)布背后的創(chuàng)新呢?
如果說(shuō),創(chuàng)新是亞馬遜的DNA,那么作為全球云計(jì)算的No.1,亞馬遜云科技會(huì)在“生成式AI創(chuàng)新”進(jìn)行怎樣的基因表達(dá)呢?
很多人也許會(huì)從基礎(chǔ)設(shè)施層、模型層、應(yīng)用層去解構(gòu)2024年亞馬遜云科技re-Invent大會(huì)上推出的一系列面面俱到的產(chǎn)品功能或服務(wù)創(chuàng)新。
但這里更想從新推出的Nova系列大模型和新一代Amazon Sagemaker角度出發(fā),去窺探亞馬遜云科技獨(dú)有風(fēng)格的GenAI創(chuàng)新敘事。
從Titan到Nova:不拘一格的6款模型打法
從2022年年底開(kāi)始,很多國(guó)內(nèi)外的科技巨頭紛紛在大模型訓(xùn)練上展開(kāi)了與OpenAI的追趕角逐。而作為云計(jì)算的No.1,亞馬遜云科技卻很少在明面的battle中去狂秀肌肉。
直到這個(gè)月初,亞馬遜云科技一口氣發(fā)布了六款Nova基礎(chǔ)模型,同時(shí)Amazon Bedrock 也集成了100多款三方的模型。相信很多人跟我們一樣好奇:亞馬遜云科技這波“不發(fā)則已,一發(fā)驚人”的操作,背后是出于怎樣的目的?
在采訪中,亞馬遜云科技大中華區(qū)產(chǎn)品總經(jīng)理陳曉建告訴了我們答案:
亞馬遜云科技去年提供了嵌入式模型Titan,今年推出了包括六個(gè)不同定位模型的Nova系列,未來(lái)還會(huì)推出speech to speech和any to any等模型。推出這些模型的重點(diǎn)是為用戶提供更好的選擇,使其能與產(chǎn)品更好地結(jié)合,實(shí)現(xiàn)更好的集成。模型的推出基于逆向工作法,通過(guò)了解客戶需求來(lái)確定,比如根據(jù)用戶在Micro、Lite、Pro、Premier 等不同層面的訴求來(lái)構(gòu)建模型,未來(lái)也會(huì)推出更多不同能力和定位的模型。
對(duì)于Amazon Bedrock集成100多款三方模型的打法,亞馬遜云科技大中華區(qū)數(shù)據(jù)分析與生成式AI的產(chǎn)品總監(jiān)崔瑋補(bǔ)充道,整體策略是以客戶需求為主的逆向工作法,致力于給客戶更多選擇,通過(guò)Amazon Bedrock 平臺(tái)部署一方和三方模型,滿足客戶多樣化需求。
為什么不是通用大模型,而是6款專(zhuān)用模型
回到這次Nova系列模型的推出,大家會(huì)發(fā)現(xiàn)這些模型各有各的強(qiáng)項(xiàng)和優(yōu)勢(shì):
Amazon Nova Micro專(zhuān)門(mén)用于處理文本、Amazon Nova Lite 和Amazon Nova Pro,即將推出的Amazon Nova Premier專(zhuān)攻多模態(tài)的理解(文本、圖像、視頻),此外,還有圖像生成模型Amazon NovaCanvas 和視頻生成模型Amazon Nova Reel。
綜合在一起看,你就會(huì)發(fā)現(xiàn),這些Nova模型基本都是在強(qiáng)調(diào)低成本、快速響應(yīng),同時(shí)又都是基于實(shí)際工作生活的使用(推理)場(chǎng)景所亟需的。
進(jìn)一步看,在未來(lái)推理將無(wú)處不在,所有業(yè)務(wù)都可能會(huì)應(yīng)用到大模型提供的推理能力。對(duì)亞馬遜云科技而言,需要向客戶提供一個(gè)能夠支持規(guī)模化推理的平臺(tái),以充分應(yīng)用亞馬遜云科技的推理能力,并幫助客戶用好自己的私有化數(shù)據(jù),實(shí)現(xiàn)性能、安全和成本方面的平衡,這也是亞馬遜云科技在re:Invent大會(huì)期間推出Amazon Nova系列模型的初衷。
為什么不是推出一個(gè)全能的通用模型?亞馬遜云科技大中華區(qū)數(shù)據(jù)分析與生成式AI的產(chǎn)品總監(jiān)崔瑋解釋了這樣做的原因——
“我們這樣做是因?yàn)榭吹娇蛻魪目尚行匝芯窟M(jìn)入生產(chǎn)階段時(shí),必然會(huì)權(quán)衡模型的延時(shí)(latency)、成本和性能。”
比如,有時(shí)客戶為確保準(zhǔn)確性(accuracy),可能接受較慢的響應(yīng)速度和較高成本,此時(shí)會(huì)選擇大模型;而對(duì)于一些日活躍用戶(DAU)達(dá)十萬(wàn)或百萬(wàn)級(jí)的互聯(lián)網(wǎng)企業(yè),可能無(wú)法承受大模型的高成本,就會(huì)選擇在性能尚可的情況下成本較低的模型。在性能(performance)尚可的情況下,客戶會(huì)傾向于選擇成本較低的模型來(lái)服務(wù)業(yè)務(wù)。
實(shí)際上,客戶會(huì)基于自身的用例以及對(duì)業(yè)務(wù)投資回報(bào)率(ROI)的考量,去判斷如何匹配和組合模型。在大型場(chǎng)景下的多個(gè)任務(wù)中,客戶通常會(huì)使用不同模型來(lái)解決不同業(yè)務(wù)問(wèn)題,進(jìn)而組建一個(gè)整體解決方案,這是極為常見(jiàn)的做法。
關(guān)于快速響應(yīng)原理,我們?cè)谔峒?Nova 模型時(shí)會(huì)涉及到“優(yōu)化的低延遲推理”,這是Amazon Bedrock提供的一項(xiàng)新功能。實(shí)現(xiàn)快速響應(yīng)的原理是從模型本身的部署和架構(gòu),到Amazon Bedrock提供的能力,再到底層基礎(chǔ)設(shè)施,實(shí)現(xiàn)了端到端的保障,從而確保整個(gè)過(guò)程的快速響應(yīng)。
新老一代的Amazon SageKaker背后
細(xì)心的朋友會(huì)發(fā)現(xiàn),除了Nova大模型,自研芯片Trainium3等硬貨,亞馬遜云科技此次眾多發(fā)布產(chǎn)品中還有一個(gè)不得忽視的變化,即,大家比較熟悉的以前的Amazon SageMaker,現(xiàn)在更名為Amazon SageMaker AI,同時(shí)亞馬遜又重新定義了新一代Amazon SageMaker。新一代的Amazon SageMaker涵蓋了分析、數(shù)據(jù)處理、搜索、數(shù)據(jù)準(zhǔn)備、AI模型開(kāi)發(fā)和訓(xùn)練、?成式AI等所有必需功能,同時(shí)全部功能都可以通過(guò)統(tǒng)?的企業(yè)數(shù)據(jù)視圖實(shí)現(xiàn)。
崔瑋同樣解釋了這種變化背后的歸因。因?yàn)樵诖蟮姆较蛏希翱蛻粼跇?gòu)建整個(gè)生成式AI的旅程時(shí),需要的不只是模型,甚至不只是生成AI這個(gè)詞,更多的是數(shù)據(jù)加AI的統(tǒng)一。新一代Amazon SageMaker就是數(shù)據(jù)加AI,首先是統(tǒng)一,統(tǒng)一的平臺(tái);第二它要開(kāi)放,第三還是要安全。我們會(huì)通過(guò)這三層,給客戶提供從數(shù)據(jù)到AI的一體化的感受。”
而對(duì)于大家比較熟悉的以前的Amazon SageMaker,定位還是AI開(kāi)發(fā)方面,所以現(xiàn)在叫Amazon SageMaker AI,它也有很多新的這個(gè)功能發(fā)布。Amazon SageMaker AI推出四項(xiàng)創(chuàng)新,助力企業(yè)更快使用熱門(mén)的公開(kāi)模型,最大化訓(xùn)練效率、降低成本,并使用其首選工具加速生成式AI模型的開(kāi)發(fā)。
一窺亞馬遜持續(xù)創(chuàng)新哲學(xué)
這時(shí)你就會(huì)發(fā)現(xiàn),大到模型的發(fā)布,小到一個(gè)工具的更名,亞馬遜云科技都做了如此“工匠”級(jí)的精心設(shè)計(jì)和需求驗(yàn)證。這背后其實(shí)都是亞馬遜前文提到的“逆向工作法”的創(chuàng)新哲學(xué)。
那么,如何理解逆向工作法?陳曉建在亞馬遜云科技2024re-Invent中國(guó)站的主題演講中做出了解釋?zhuān)?/span>
“我們始終在傾聽(tīng)客戶的心聲,著眼于長(zhǎng)遠(yuǎn)的發(fā)展。感謝成為我們客戶的企業(yè),正是因?yàn)樗麄冊(cè)敢獬槌鰧氋F的時(shí)間,幫助我們?nèi)チ私馐裁词强蛻粽嬲枰脑朴?jì)算功能,以及如何為客戶提供更好的服務(wù),從而在過(guò)去十多年我們才能夠基于客戶需求不斷創(chuàng)新,來(lái)最終滿足這些需求。這個(gè)就是我們常說(shuō)的customer obsession walking backwards,以客戶為中心、逆向工作法。這個(gè)已經(jīng)深深地融入到亞馬遜云科技的基因之中,從最開(kāi)始創(chuàng)立的時(shí)候就已經(jīng)確立。”
這也讓人想到了今年re-Invent大會(huì)上,亞馬遜云科技高級(jí)副總裁Peter DeSantis那句比喻:
“亞馬遜雨林的扶壁根系,支撐著世界上最大的樹(shù)木生長(zhǎng)在并不穩(wěn)定的土壤系統(tǒng)中。扶根可以從一棵樹(shù)的底部延伸數(shù)百英尺,并與附近的樹(shù)木互鎖構(gòu)成一個(gè)堅(jiān)實(shí)的基礎(chǔ),來(lái)支撐這些巨大的雨林。而亞馬遜云科技最獨(dú)特的事情之一,是我們的領(lǐng)導(dǎo)者能夠在細(xì)節(jié)上花費(fèi)大量時(shí)間精力,去了解客戶和服務(wù)真正發(fā)生了什么事情,從而能夠快速做出決定,甚至有可能在問(wèn)題發(fā)生之前就解決或預(yù)防它們。”
理解了這一點(diǎn),也就理解了這次亞馬遜云科技2024re-Invent大會(huì)上推出的發(fā)布為什么會(huì)多到讓人眼花繚亂,但每一項(xiàng)發(fā)布都能讓你找到似曾相識(shí)的場(chǎng)景和痛點(diǎn)。理解了這一點(diǎn),也就窺見(jiàn)了亞馬遜云科技獨(dú)有的re-Invent創(chuàng)新文化。