大神李沐、快手元老李巖被曝離職后轉投大模型,ChatGPT掀起AI創業狂飆
最近,互聯網大佬紛紛投身大模型賽道。
昨天,李沐大神離職亞馬遜、去做大模型的消息,如同驚雷一般炸響了大家的社交網絡。
緊接著,今天又曝出前快手AI核心大佬李巖在2022年離職快手后成立的新公司,做的也是大模型。
顯然,自從ChatGPT讓全世界看到了AI上天入地般的應用場景,國內企業的AI模型層競爭,已經開始白熱化了。
快手大佬李巖創業,進軍多模態
李巖在2022年下半年成立了AI公司「元石科技」,主要進行多模態大模型的研發。
李巖是工號在75上下的快手老員工,也是快手AI技術研發的核心人物。
2015年11月,在時任快手CEO的宿華的支持下,李巖組建了內部第一個深度學習部門DL(Deep Learning)組,目標是構建算法模型對違法違規的視頻內容進行識別。
隨后,快手對視頻內容理解產生了更多的需求。2016年,李巖將團隊的名字從DL組改為MMU(Multimedia understanding,多媒體內容理解)組,在解決安全合規問題之外,涉獵語音、文字、圖像等多種形式的算法模型研發。
在2018年的CNCC大會上,李巖便以題為「多模態內容生產與理解」的演講,強調了多模態模型技術的重要性:
- 改變人機交互的方式
- 使信息分發更加高效
以我們經常刷的短視頻為例,除了視覺、聽覺和文本這些多模態信息外,用戶的行為也是另外一種模態的數據。
如此一來,視頻的本身再加上用戶的行為,就共同構成了一個非常復雜的多模態問題。
而多模態研究的目的便是,讓人機交互的方式變得越來越自然和舒適。
然而,多模態的研究難度頗高。
一方面要面對單模態的語義鴻溝問題,以及如何針對不同模態的數據進行綜合建模的異構鴻溝問題;另一方面,還要解決由于多模態數據集構建困難而造成的數據缺失問題。
當時,學術界有不少研究還是停留在單模態領域,而李巖則堅定地認為,未來多模態會成為更有價值的研究方向。
在快手的經歷,讓李巖對于AI在短視頻上的生態有了第一線的深刻理解,2021年,他選擇從快手離職。
2022年下半年,他成立了元石科技,根據36氪的獨家求證,元石科技主攻的就是多模態大模型的研發。
師徒一體:寫書、創業、再創業
而昨天,李沐大神疑似加入大模型創業的消息,也瞬間在社交網絡上刷屏。
根據公號「親愛的數據」消息,「參數服務器之父」Alex Smola在今年2月離職亞馬遜,并創辦了一家名為Boson.ai人工智能公司。
至于這家新公司的介紹資料并不多,目前官方頁面還在建設中。
鏈接:https://boson.ai/
可以肯定的是,要做大模型相關的項目。
另根據Alex的領英主頁介紹,「我們正在做一件大事。如果你對可擴展基礎模型感興趣,請聯系我?!?/span>
值得注意的是,在這家公司GitHub主頁上,亞馬遜首席科學家李沐也貢獻了代碼。
因此,外界猜測李沐現已加入了Boson.ai,跟隨導師一起去創業了。
不過,到目前為止,其主頁還未更新。
李沐和Alex Smola曾在2016年創辦了一家名為Marianas Labs數據分析算法公司。
當時,李沐任CTO兼聯合創始人。
李沐曾在「博士這五年」一文中提到,
當時深度學習的火熱導致各種巨資收購初創司不斷。
Alex便和他拿了幾十萬的天使投資風風火火干了好一陣子,Alex寫爬蟲,他自己跑模型,后來賣給一個小上市公司公司1-Page。
要說師徒二人的相識最早是在卡耐基梅隆大學(CMU)。
2012年9月,李沐前往CMU深造,師從的便是Alex Smola。
當時,Alex還在谷歌任職,而且沒有經費,就把他丟給了Dave Andersen。因此,李沐便有了兩個導師,一個做機器學習,一個做分布式系統。
在CMU的前半年,李沐每周都會與兩位導師一起聊一個小時。
由于兩位導師風格迥異,而Alex反應特別快,想要跟上他的節奏很難。若想闡述自己的想法,需要做更多的功課。
而Dave會幫助李沐把一個東西理解透,不會給出很多想法。
在兩個導師的輔導下,李沐迅速成長。
在CMU求學的第二年,正當余凱等人在做深度學習,李沐便也加入這波研究熱潮。
基于對分布式深度學習框架的興趣,他選擇與陳天奇合作,將CXXNet作為起點,做深度學習相關項目。
在兩人一起寫xgboost 分布式啟動腳本時,便發現文件讀取可以是多個項目共同使用。
為了避免重復造輪子,李沐和陳天奇在合力在Github上創建了一個叫DMLC的組織,隨后更是創建了隨后大獲成功的MXNet。
2016年7月,Alex加入了亞馬遜。與此同時,李沐便帶著MXNet先以兼職身份加入亞馬遜,畢業后便選擇留下。
2019年期間,師徒二人還曾在UC伯克利一起講過課。
2021年,兩人在斯坦福大學也一起講授「Practical Machine Learning」。
值得一提的是,《動手學深度學習》這本書便是由李沐,美國伊利諾伊大學香檳分校計算機科學博士Aston Zhang,還有導師Alex一起所寫。
這本書推出后便大受歡迎。作為MXNet的作者之一,李沐的這本《動手學深度學習》也是使用 MXNet 框架寫成的
大模型路上,還有誰?
多模態的方向,是李巖很早就想做的。而李沐追隨導師去創業,或許多少都受到了ChatGPT爆火的影響。
而國內企業的AI模型層競爭,已經開始白熱化了?,F在的大模型賽道中,擠滿了巨頭派、大佬派、海歸/大廠高管派、小創業公司轉型派、教授派、醬油派等各路選手。
2月13日,已經從美團退休2年的王慧文帶著一紙「AI英雄榜」重回大眾視野,稱自己將拿出5000萬美元「帶資入組」,且「不在意崗位、薪資和title,求組隊」。
前有王慧文把大模型創業的門票拉高到5000萬美金之后,后有「出門問問」創始人李志文官宣下場大模型競賽。
李志文曾在2020年領導團隊,訓練出大模型UCLAL
另外,還有前搜狗CEO王小川也發文隱晦地宣布,自己即將進入「中國的OpenAI」的戰場,并向36氪承認自己在快速籌備中。
2月26日,銜遠科技的創始人、首席科學家周伯文也發布一則消息稱招募合伙人,一起打造中國版ChatGPT。
最近各種需求的激增,已經表明了國內生成人工智能產品的潛在市場大得驚人。
ChatGPT的爆火,意味著奇點已至,它引發了更底層、更深層的變化,新一代AI將融合物理世界和信息世界,實現知識、計算、推理的閉環。
短短兩天內,就有兩位大佬被曝下場創業,開辟大模型賽道。而國內巨頭們預告的發布會,都將在幾個月內召開。
所以,這場自開年就打響的AI大模型國內追逐賽,或許馬上就能看到有選手沖刺終點了。