云計算一哥的生成式AI之道:Choice Matters
引言:AI大模型,并不是一個贏家通吃的市場。
自OpenAI在2022年發布ChatGPT以來,無論是科技巨頭還是初創公司,各個玩家可以說是紛紛加大投入,試圖在模型性能上超越彼此。
似乎追求單一、性能卓越的AI大模型已然成為一種趨勢,各類Benchmark上的奪冠也好似一張得到市場認可的入場券。
然而在如此打法成為主流的同時,一個在AI大模型時代以來一直看似低調,也鮮有大聲量地高喊“大模型性能第一”的科技巨頭,卻在時隔兩年多之久,以截然不同的方式在大模型市場里驚艷亮相。
它就是云計算一哥——亞馬遜云科技。
對于亞馬遜云科技在AI大模型時代的定位,目前有一種非常貼切的比喻,叫做“沉睡的雄獅”。
之所以如此,是因為亞馬遜云科技此前幾乎是以“工廠模式”來推動大模型的發展,在業界聲響最大的便是集成各路大模型的Amazon Bedrock。
即便在早期有發布過自研大模型Titan,但有一說一,似乎也是在大模型飛速迭代的浪潮中被淹沒。
然而,正當大眾以為亞馬遜云科技在AI大模型時代會持續扮演一個“工廠”角色之際,就在前不久自家的年度盛宴re:Invent 2024中,它卻高調發布了全新的基礎模型——Amazon Nova系列。
而且是一口氣六款模型,涵蓋文本對話、圖片生成和視頻生成,并且也罕見地把與各類模態主流玩家的PK測評成績直接亮了出來。
以視頻生成模型Amazon Nova Reel為例,效果是這樣的:
于是乎,為何在沉寂兩年后才會有此動作?亞馬遜云科技的打法又是否能符合市場發展?……
種種問題,亟待回答。
亞馬遜的“AI步法”:Choice Matters
其實在今年亞馬遜云科技的re:Invent中,若是一定要提煉一個關鍵詞,那么Choice(選擇),無疑就是最搶眼的那一個。
展開這個關鍵詞,則正是“云計算一哥”在AI大模型時代下的打法:
會做選擇,比擁有單一強大的大模型更為重要。
這是因為在亞馬遜云科技看來,大模型市場并不是一個贏家通吃的市場;這就與其它公司形成了鮮明對比。
然而,亞馬遜選擇了一條不同的道路,通過其Bedrock等工具支持來自多個提供商的不同模型,而不是僅僅專注于構建自己的強大模型。
而這種背后蘊含“沒有一個模型可以一統天下”的模式似乎也正在被市場所接納。
根據Menlo Ventures的報告,公司通常在其AI服務中使用3個或更多的基礎模型,根據不同的用例或結果路由到不同的模型。
這種趨勢表明,即使是市場份額佼佼者的OpenAI,也面臨著來自其他采用多模型策略的公司的挑戰。
同樣是根據Menlo Ventures的報告,一個較有說服力的數據是這樣的:
采用亞馬遜云科技模式的Anthropic在AI模型市場的份額翻倍至24%,而OpenAI的份額從50%下降到34%。
不過與此同時,自身擁有先進的AI大模型同樣也有助于亞馬遜云科技吸引更多的AI開發者。
雖然早期亞馬遜云科技所推出Titan并沒有在大模型圈里泛起太大的浪花,但這一次的Nova系列,確實是以其效果和實力博取了不小的關注。
而這一切的背后,依舊是貫徹亞馬遜云科技的根本問題,即客戶有所需要。
因此,亞馬遜云科技在大模型時代下的“AI步法”就非常清晰了——
為客戶提供“多快好省”的選擇權,而不是“一統天下”的市場主導權。
那么接下來的一個問題是:
提供了怎樣的AI選擇權?
就在今天剛結束的re:Invent 2024中國行全國巡展北京站活動中,亞馬遜云科技大中華區產品總經理陳曉建對這一問題做了再次的回顧。
△亞馬遜云科技大中華區產品總經理,陳曉建
在短短90分鐘的主題演講中,露出的“AI可選項”多達30多個,平均下來就是每三分鐘一個!
縱觀整場活動,最直觀的感受,就是這些回顧的“全新發布”涵蓋了整個生成式AI的全周期——
從最底層的基礎設施,到中間的模型服務,再到頂層的AI應用,是屬于全棧的那種。
而之所以如此,陳曉建在現場做出了如下解釋:
我們不僅在云的核心服務層面持續創新,更在從芯片到模型,再到應用的每一個技術堆棧取得突破,讓不同層級的創新相互賦能、協同進化。
我相信,只有這樣全棧聯動的大規模創新才能真正滿足當今客戶的發展需求,加速前沿技術的價值釋放,助力各行各業重塑未來。
“全新發布”數量雖然驚人,但按照生成式AI各層級來看脈絡也是較為清晰,可以分為五個大亮點:
- 計算
- 存儲
- 數據庫
- 分析
- AI推理
那么接下來,我們就來再次深入回顧下今年re:Invent中的那些高光時刻。
新款自研基礎模型
首先,我們先來看下“AI推理”部分的產品,或許也是大家最感興趣、最有感知的一個內容——大模型。
亞馬遜云科技所發布的新款自研基礎模型,名曰Amazon Nova,是有一點點震撼在身上的。
整體來看Amazon Nova共有四個“杯型”,它們分別是:
- Amazon Nova Micro:僅限文本對話,主打一個低價格和低延遲;
- Amazon Nova Lite:低成本的多模態大模型,處理圖像、視頻和文本輸入的速度極快。
- Amazon Nova Pro:高性能的多模態大模型,精度、速度和成本最佳“配方”,可處理廣泛的任務。
- Amazon Nova Premier:亞馬遜最強多模態大模型,可處理復雜的推理任務,也可用于蒸餾客戶定制化的模型。
其中一大亮點便是成本大幅降低。
據了解,在各自智能類別中,Amazon Nova Micro、Lite和Pro應用成本比“模型工廠”Amazon Bedrock中表現最佳的模型至少降低75%,同時也是Amazon Bedrock中對應類別速度最快的模型。
前三者已經上架亞馬遜云科技的Amazon Bedrock,而Premier版本則將于2025年第一季度推出。
除此之外,還有Amazon Nova Canvas,主打的是圖像生成,用官方的話來說,是達到了“State-of-the-art”(最先進)的水平。
在現場,陳曉建也展示了與DALL·E 3和Stable Diffusion Large 3.5的評估測試上的比較,圖像質量等維度上均勝出。
在圖像生成之后,亞馬遜云科技還發布了視頻生成模型——Amazon Nova Reel。
據了解,目前6秒鐘時長的視頻生成已經正式可用,2分鐘版本的也在路上了。
同樣的,Amazon Nova Reel與Runway家的Gen-3 Alpha之間的評測比試結果:視頻質量勝率61.4%、視頻連貫性勝率71.6%。
但這還不算完,Amazon Nova的下一步也已披露——
不僅要Speech-to-Speech,更要Any-to-Any!
一切皆可生成,是值得期待一波了。
而作為承載它們的“模型工廠”Amazon Bedrock,這一次也有不少的升級動作。
首先就是在模型的選擇上,新增了多個choices,例如首家提供Luma AI和poolside模型,以及更新的Stability AI最新模型等。
其次,全新發布的Amazon Bedrock Marketplace,可以為客戶提供100多個熱門、新興及專業模型。
還有Amazon Bedrock Knowledge Bases,現在支持可以支持GraphRAG等知識庫功能增強數據利用能力。
在性能方面,Bedrock還推出了低延遲優化推理,由此,用戶可以在使用最先進的大模型基礎上,還享受卓越的推理性能。
值得一提的是,Llama 405B和Llama 70B低延遲優化版本,在亞馬遜云科技上展現出超越其他云提供商的出色表現。
最后,通過自動推理檢查功能和多智能體協作等創新,進一步增強AI安全性并推動智能體發展。
Amazon Q Developer則是引入了三款先進的智能體。
它們能夠自動執行單元測試、生成文檔和進行代碼審查,同時通過與GitLab的深度整合,拓寬了應用范圍。
此外,它還推出了新的轉型特性,旨在加快Windows.NET、VMware和大型機工作負載的遷移與現代化進程,有效減少轉型周期和成本。
同時,Amazon Q Business和Amazon Q in QuickSight的洞察力得到了加強,簡化了復雜工作流程自動化的實現方法。
云計算,也全面升級
說完大模型,我們再來看下亞馬遜云科技的“老本行業務”——云計算。
這次升級主要圍繞三大核心領域展開:計算(Compute)、存儲(Storage) 和數據庫(Database)。
每一項都可以說是展現出了前所未有的性能提升與成本優化。
在計算(Compute)層面,亞馬遜云科技推出了性能全面升級的Amazon EC2 Trn2實例。
Trn2實例搭載第二代Trainium芯片(Trainium2),相比上一代Trn1,性能提升如下:
- 訓練速度提升4倍,顯著縮短模型訓練時間,助力企業更快落地AI應用;
- 內存帶寬提升4倍,滿足復雜模型對于數據高并發處理的需求;
- 內存容量提升3倍,為大規模參數模型提供強大支持。
更重要的是,Trn2實例的性價比提升顯著,相比傳統GPU實例(P5e和P5en)高出30-40%,大幅降低了算力成本。
對于超大規模計算需求,亞馬遜云科技還推出了Trn2 UltraServer。
每臺UltraServer集成了64顆Trainium2芯片,并通過NeuronLink高速互聯實現2TB/s帶寬和1微秒級延遲。
這款產品為超大規模AI模型訓練提供了理想的算力平臺。
除此之外,在芯片層面上,亞馬遜云科技宣布將在2025年推出Trainium3芯片。
據悉,Trainium3將采用3納米工藝制造,提供兩倍于Trainium2的計算能力,并提升40%的能效。
在存儲(Storage)層面,亞馬遜云科技發布了專為表格數據設計的Amazon S3 Tables,性能和效率再次升級。
Amazon S3 Tables引入了一種創新的存儲解決方案,專門針對表格數據優化,并兼容Amazon Athena、Amazon EMR以及Apache Spark等主流查詢工具,以便用戶能夠便捷地執行數據查詢操作。
作為S3的第三種存儲類別,表存儲桶與通用存儲桶和目錄存儲桶相輔相成,它被設計為一個分析型數據倉庫,適合存放多種模式的Iceberg格式表格。
S3 Tables在性能上相較于傳統的自管理表格存儲有顯著提升,查詢速度可提高至3倍,事務處理速率可達10倍,且享有全面托管的服務帶來的操作便利。
在數據管理中,元數據的作用日益凸顯,例如,手機中存儲的大量照片能夠通過元數據快速定位,使用自然語言即可迅速檢索到特定照片。
為滿足此類需求,亞馬遜云科技推出了Amazon S3 Metadata的測試版,旨在提供更加智能和高效的元數據管理功能。
Amazon S3 Metadata 提供了一種智能化、便捷的元數據管理方案,實現了近乎實時的元數據更新,幫助用戶高效地組織、識別和利用S3數據,支持業務分析和實時推理等應用場景。
該功能支持對象元數據管理,既涵蓋系統生成的詳細信息(如文件大小和來源),也允許用戶自定義元數據。用戶可以通過標簽為對象附加額外信息,如產品SKU、交易ID或內容評級,進一步提升數據的分類與檢索效率。
此外,這些元數據信息被無縫整合到 S3 Tables 中,進一步強化了數據的管理與分析能力。
最后一層,便是數據庫(Database)了。
亞馬遜云科技發布了新型無服務器分布式數據庫Amazon Aurora DSQL,旨在解決傳統數據庫在擴展性和性能方面的挑戰,目前可以實現:
- 跨區域強一致性和低延遲;
- 無限擴展,可輕松處理TB至PB級數據;
- 超高可用性,達到99.999%的可靠性。
與此同時,Amazon DynamoDB global tables也增加了多區域強一致性支持,進一步增強了其分布式數據庫服務能力。
數據分析能力也是Up Up Up
此次發布的最后一部分,便是分析板塊。
亞馬遜云科技所發力的點,便是其一站式數據、分析與AI解決方案中心——新一代Amazon SageMaker。
新一代SageMaker的核心是SageMaker Unified Studio。
這是一個單一的數據和AI開發環境,它整合了Amazon Athena、Amazon EMR、AWS Glue、Amazon Redshift、Amazon Managed Workflows for Apache Airflow (MWAA)以及現有的SageMaker Studio中的工具和功能。
其次是Amazon SageMaker Lakehouse,可以統一Amazon S3數據湖、Amazon Redshift數據倉庫和第三方及聯合數據源。
除此之外,還包括Amazon SageMaker HyperPod的新訓練配方功能、靈活訓練計劃和任務治理功能,以及在Amazon SageMaker中使用亞馬遜云科技合作伙伴的熱門AI應用。
這些功能將幫助客戶更快開始訓練流行模型,通過靈活訓練計劃節省數周時間,并將成本降低高達40%。
以上就是今年亞馬遜云科技給予大模型時代客戶們的種種新的選擇了。
而這種“以客戶為中心,逆向工作(work backward)”為基因的云計算巨頭,還將以“提供選擇權”的方式在這個時代給我們帶來怎樣的驚喜,是值得期待一波。