專訪GMI Cloud創始人Alex Yeh:算力即未來,不做AI時代的旁觀者
嘉賓 | Alex
作者 | 云昭
出品 | 51CTO技術棧(微信號:blog51cto)
Alex Yeh回憶過去兩年半的創業歷程,用“一頭深海中求生的鯊魚”來形容GMI Cloud這家新創公司。海水中礁石隱藏在未知的角落,繞開礁石繼續前行則成為了這條鯊魚的常態。
Alex Yeh是AI Native Cloud 提供商 GMI Cloud 的創始人兼CEO。成立于2023年,GMI Cloud是他的第二次創業,在創業之前,他是亞太知名私募和風投公司里的董事,是加密貨幣與區塊鏈生態圈里最年輕的合伙人,投資相關的項目超過 100 個。
在“以天為單位演進、充滿未知”的AI領域,這個比喻用來描述創業公司的探險旅程,頗為形象。不過現實往往更為精彩。
兩年半前,Alex決定從美國創業,經過一番艱苦,終于尋得了500多公頃的場地和100多兆瓦電廠,開啟了一段全新的AI Infra創業旅程,4個月內Alex馬不停蹄地干了4件事情:找來自谷歌 X 部門的技術大牛、建立軟件部署平臺、跨國新建數據中心、尋找錨定客戶。
而這4個月對于這次創業而言也僅僅只是旅途中的開始,還有很多問題需要勇敢者去探索、去解決?!皩τ贏I創業而言,你不可能一開始就能預測到它具體的未來形態,也不知道具體會在何時迎來爆發。但你必須有一個保持十年的TrueNorth。它就如同航空母艦一樣,不可動搖?!盇lex 非常認真地說到。
2025開年,DeepSeek R1的推出后,全球的用戶為之震撼,所有人都在爭相測試這款出色的模型,GMI Cloud團隊也不例外,在最短的時間內完成了基于H200的專屬R1模型部署適配和優化,也正因此,Alex的客戶來電甚至多到被打爆了。51CTO獲悉,GMI Cloud基于高端硬件提升AI推理效能,提高Token吞吐效率,是團隊目前每天都在持續進行的聚焦點。
Alex表示,今年Q1,GMI Cloud的營收之高已經達到了去年一年營收的三倍。這是一種非常迷人的信號:大模型進入推理階段后,人們都在尋求什么樣要求的AI云服務,為什么GMI Cloud可以從谷歌、微軟、亞馬遜這樣的云廠商中虎口奪食?AI Infra側和AI應用側正在發生著怎樣的演進?
帶著這些問題,我們跟Alex聊了80分鐘。
1.從未雨綢繆到枕戈待旦
科技創新總是會被短期高估、長期低估,押注AI更是如此。作為一家初創公司,如何度過起量之前的等待期是一件非??简瀯撌既伺袛嗔Φ氖虑?。
早在DeepSeek R1推出前的五六個月,Alex做出了一項重要的決定:GMI Cloud需要快速開發一套全面的推理引擎框架。Alex回顧當時的決定,認為AI從預訓練階段進入到推理階段是一件很清晰的、必然發生的事情。“大模型已經訓練得足夠好用,已經有很多不同的產品,比如航空公司的呼叫中心的AI客服已經可以幫改簽機票、出國旅行時的手機上的即時轉譯App等等。那之后會是什么樣子?肯定就會發生在edge端或local端,而且需要極低的延遲?!?/p>
彼時,Alex為這個引擎定下了三個要求:Auto Scaling(自擴容)、Global Scaling(全球擴容)、Hotswap(熱切換)。前兩項擴展很容易理解,那么為什么Alex特別要求了熱切換呢?據介紹,在推理階段,機器宕掉對于客戶的影響非常大,熱切換就是要讓客戶所運行系統能夠足夠可靠,即便出現宕機的情況,也能持續有機器快速補充。據悉,GMI Cloud目前已在3月中旬正式官宣新產品“Inference Engine自研推理引擎云平臺”上線,該推理引擎的可用性高達99.995%。
也正是此番提前6個月的未雨綢繆,才造就了上文提到的Alex電話被打到爆的一幕。“2月DeepSeek爆發,一時間我們幾乎所有客戶的訴求都變成了推理”,形勢變化如此之快,超出了Alex的預期。
當然DeepSeek的到來,同樣也給Alex拋出了新的問題。事實上,包括AMD等很多的硬件廠商都曾來找GMI Cloud談適配的合作,不過Alex都婉拒了。“我們畢竟是云廠商,而不是硬件廠商?!弊鳛槿肆唾Y源有限的初創公司,首要的工作重心還是快速地scaling全球市場,而不是硬件多樣化?!昂M馐袌鲋?,現在流行的模型是DeepSeek R1,而目前適配DeepSeek R1最舒服的硬件就是H200。同時這也是目前大多數客戶的高性能推理的使用訴求所驅動的。現在如果選擇不同硬件廠商的話,勢必會降低Global Scaling的節奏。如果我們達到了一定的規模,比如Coreweave的體量,才會開始考慮硬件多樣化的問題?!?/p>
我們了解到,GMI Cloud現在的工程團隊忙碌狀態可以用枕戈待旦來形容:“業內技術迭代非常迅速,基本每周都會有新發布的技術需要團隊快速跟進。這周英偉達更新了Dynamo,下周某個社區發布了新論文,我們都需要將這些新技術、新論文以最快時間完成消化,并持續迭代我們的技術版本上線到自己的平臺?!?/p>
2.找到錨定客戶,然后拼命迭代
我們在訪談中有聊到一個假設性的問題:如果讓Alex選擇在應用側創業,他會選擇C端還是B端。
Alex最后選擇了B端。“B端創業和C端創業還是有著不同的變現邏輯的。不管國內還是海外,ToB創業通常需要一個有實力的公司來支持。而ToC則更多地要找到比較大的應用產品讓用戶蜂擁而入。而且,C端產品爆發后的市場反饋處理起來也會非常有挑戰,同時還要保證產品的迭代速度與最新的潮流一起向前?!?/p>
在Alex看來,每一位AI創業者都是超人,自己的superpower更適合在B端釋放。
談及自己創業的心得,Alex給出了一個“拼命三郎式”的答案:找到自己的錨定客戶,不斷去溝通、去了解客戶的需求和反饋,拼命地去打磨、迭代產品方案,來實現客戶的所想所需。
當然,以第三者的身份去看這個問題,Alex對C端出海應用充滿了期待。“中國出海企業,在toC市場上有很大的優勢。國人最厲害的地方就是新技術的落地。國人非常擅長做不同的產品推廣營銷以及硬件的整合,同時還有一個不容小覷的優勢,就是開源?,F在許多新的開源社區都是華人主導的,只要產品得到開源社區的支持,甚至網站都不用做,就可以賺到錢?!?/p>
整體上看,B端和C端的機會都很大。Alex舉了一個文生圖、文生視頻賽道的例子,“toC可以面向designer做一個studio,toB則可以選擇跟Adobe等大型企業去合作,或者做不同行業的定制API等等。這都取決于創業者自身的想法?!?/p>
3.通用Agent還有很遠的路要走
目前距離Agent爆發還哪些問題有待解決?
Agent始終是一個繞不開的話題。Alex很果斷地判斷:通用Agent的爆發時機還沒有到。首先,在某些領域,模型本身做的不是特別好,比如模型跟物理世界的交互能力還不夠好;其次,算力成本核算下來依舊過高;此外,不同場景的壁壘有待打通,私有的DataSet就是一個明顯的例子,只有將這些數據整合起來有可能以Agent的形式去提供客戶所需的服務。
但就某些垂直場景來看,已經有不少落地Agent的機會。比如自媒體領域的內容生成、AI PPT等,再比如編程領域的Cursor、Windsurf等等。這些以文字為主的應用已經取得了較大的突破。
而算力成本方面,DeepSeek推出后,開源模型的性能甚至比閉源模型都要高。隨著AI Infra持續對內存、硬件、模型的優化,每個Token的成本會一直降下去,甚至還有更低精度、更便宜成本的方案。
場景壁壘方面,擁有不同垂類私有數據的公司可以把不同垂類領域的Agent開發出來,只要產品體驗足夠好,相信就會有客戶愿意將資料交給你。
“所以說,就我個人的初步判斷,現階段Agent距離全方面爆發還有很長的路要走,走的比較快的應用更多還是在AIGC、文生圖這類賽道上。但未來幾年,隨著數據飛輪效應越來越明顯,不斷演進的應用會產生足夠多真實的交互數據,這些數據進而會催生更強大的多模態大模型,而更強大的模型則會進一步帶來新的一輪應用的爆發。”
4.先求有、再求好、再求便宜
數據的問題交給應用側,而降成本的問題則落到了像GMI Cloud這樣的云供應商的肩上。正如前文所說,現在市面上算力Token的價格依舊昂貴,尤其在海外。這正是GMI Cloud一直以來聚焦在做的工作,在不犧牲性能的情況,通過PD分離、EP等各種更好的技術將單個Token的成本砍下去。所以高性能與低成本是并不沖突的。
談到“API價格戰“”方面,Alex表示純砍價的做法是無意義的。因為從客戶需求看,“先求有、再求好、再求便宜”是一項不可忽視的市場規律?!爸话殉杀究车阶畹?,但穩定性不能保證也是沒有意義的。又或者說你雖然在美國最便宜,但客戶需要在亞洲地區實施業務,本土化的’性價比‘才是客戶最看重的?!币虼耍绻坝小焙汀昂谩倍紱]有做到,客戶就根本不可用,這樣把價格降再便宜也于事無補。
近日,GPT-4o吉卜力風格圖片功能非常火爆,用戶推理的需求非常旺盛,OpenAI不得不采取了速率限制。那么,爆火的高性能推理需求到來之后,成本降低的速度又會怎樣呢?
Alex表示,事實上英偉達或其他廠商每一兩年就會提出新的硬件架構模式,推理的成本也會以倍速的方式在降低。
可以想象,5年之內成本基本就降到幾乎為零了。
隨著Scaling Law和摩爾定律的不斷演進,Alex認為有兩個確信的趨勢:第一,大模型廠商會互相卷,模型會變得又小又好用,又便宜;第二件,半導體廠商會在推理場景上互相角逐,成本也會越來越低。而云廠商則將模型和硬件整合到一起來繼續做調優,隨著時代的演進,Token成本的大眾化將不再是一個問題。
5.我們是 “Shopify of AI”
時鐘撥回到去年10月,GMI Cloud拿到了8200萬美元的A輪融資。接連多年的工作和創業經歷,Alex找到了投資人們的理解習慣。Alex經常會跟投資人用這樣的比喻來介紹自己的公司:Shopify of AI。
Shopify是一家全球知名的電商平臺,成立之初就致力于幫助任何一位創業者或者網紅去快速建店,實現創業夢想。而這在當時的美國,基本上已經被Ebay、Amazon綁架了,創業者被捆綁其中,自由度很差。而Shopify則不同,它給了創業者更為自主可控的選擇。
Alex認為,而這也是GMI Cloud所想要做的。“過去大部分的創新都已經被美國“三朵云”綁定了,對于客戶而言很難有突破性質的價值增量。我們想把Envrionment歸還給客戶。”
怎么實現這一點呢?GMI Cloud在產品設計上給客戶留足了選擇的空間。GPU Instance、Cluster Engine、Inference Engine,這三層允許用戶彼此獨立購買,也可以一起購買。用戶可以自由選擇、組合和擴展,既可以使用自己本地的模型,也可以使用GMI Cloud調好的模型,甚至也可以把第三方的平臺搬過來。GPU也一樣,不存在完全綁定的情況。
我們注意到GMI Cloud 的全新推理引擎產品Inference Engine近期在英偉達GTC2025大會上正式發布,這被外界視為GMI Cloud涉足MaaS層的一個重要信號。Alex解釋道,Inference Engine其實面向的是有產品想法但缺乏機器學習背景的團隊。通過Inference Engine,那些product genius就可以專注于做產品、做推薦、搞流量,而無需再在基模開發調試上浪費精力和成本,只需要在Marketplace中選擇模型即可。
6.創新者在洪流中尋找新大陸
最后我們問到了GMI Cloud的未來3-5年的規劃。Alex表示特別想做好一個AI of Internet。“我覺得這是一個超級酷的事情,我想要做一個隱形的GPU云網絡,當一個隱形的support的角色,去支持那些創業團隊或企業內的創新者去實現自己心中的AI產品。我們提供面向不同AI應用研發場景的算力支持和引擎支持,跟上AI發展的所有步伐,切身入局去做一些真正可以改變AI產業發展的事情,不做這個時代的旁觀者?!?/p>
言語之中,Alex對于成立28個月的公司充滿著一種“屠龍少年”的理想:現在的超級巨頭真的讓人又愛又恨,而GMI Cloud未來要做一個全棧式的AI云服務公司,不止是AI云服務公司,而是從存儲到計算,以及各種上層應用,而每一層都是模塊化的。
“就像豪華型酒店一樣,客人可以拎包入住,住起來非常舒服,如果你喜歡房間里什么東西,你都可以拿走。”
【嘉賓介紹】
Alex Yeh 是 GMI Cloud 的創始人兼 CEO,在他的卓越引領下,GMI Cloud 迅速成為全球 AI 云計算領域的領先品牌,助力眾多企業實現 AI 的即時部署與高效擴展。
作為一名極具前瞻性的連續創業者,Alex Yeh 的職業軌跡亮點頻出。他曾先后在 CDIB Capital、Globaltec Capital 擔任董事,專注于 VC/PE 以及 AI 領域的投資工作。在創辦GMI Cloud之前,他是加密貨幣創投機構 Headline Crypto/ IVC 的聯合創始人,也是加密貨幣與區塊鏈生態領域最年輕的合伙人,投資項目超過 100 個,為行業發展注入了強大的資本活力。
憑借在云計算、AI 及 Web3 領域沉淀的深厚專業知識與豐富實踐經驗,Alex Yeh 不斷推動行業的創新突破。2023年,他創立GMI Cloud,將目光聚焦于 AI 基礎設施領域,致力于挖掘其在細分行業的潛在價值,全力推動 “AI + 全產業” 的算力智能化升級。
本文轉載自??51CTO技術棧??,作者:云昭
