一家高校實驗室,走出12家明星AI初創公司!Pieter Abbeel:我的NB學生們
一家高校實驗室 ,能走出多少個知名 AI 初創公司的創始人?
強化學習大牛、UC 伯克利教授 Pieter Abbeel 淺淺統計了一番:我帶過的學生里,也就 12 個吧。
這些公司的名氣都不小:OpenAI、Perplexity、Physical Intelligence、Inception AI、Reflection…… 相信你都聽說過。
剛剛,Pieter Abbeel 用一句話和一張配圖,低調宣傳了一下讓他驕傲的學生們:「那些獲得博士學位或從事博士后研究的創始人,曾在伯克利實驗室渡過一段美好的時光,現在他們開始了他們的創業之路。」
Pieter Abbeel 是加州大學伯克利分校電氣工程與計算機科學系的教授,同時也是伯克利機器人學習實驗室(Berkeley Robot Learning Lab)主任和伯克利人工智能研究實驗室(BAIR)聯合主任。
在人工智能和機器人領域享有盛譽的專家 Pieter Abbeel ,不僅研究成果在學術界產生了深遠影響,他帶出的學生在不同領域也取得了非凡成就。
下面我們盤點一下,Abbeel 口中的這些優秀學生們(人名后的信息為企業名+當前估值)。
John Schulman-OpenAl (350B)
John Schulman 是一位著名的人工智能研究科學家,尤其在強化學習和大語言模型領域有著重要貢獻。
2015 年 12 月,Schulman 連同奧特曼等人共同創立了 OpenAI,并在其中擔任重要角色。他在 OpenAI 領導了強化學習團隊,參與創建了 ChatGPT,并從 2022 至 2024 年共同領導了后訓練團隊。Schulman 于 2024 年 8 月從 OpenAI 離職。
Schulman 離開 OpenAI 后,加入競爭對手 Anthropic,專注于 AI 對齊研究。然而,他在 Anthropic 僅工作了半年,于 2025 年 2 月再次離職。
今年 2 月,Schulman 成為初創公司 Thinking Machines Lab 的聯合創始人兼首席科學家。Thinking Machines Lab 是一家「人工智能研究和產品公司。」 CEO 為 OpenAI 前 CTO Mira Murati,她曾在 OpenAI 領導過研究、產品與安全方面的工作。
谷歌學術頁面顯示,John Schulman 的學術引用總數已經超過 10 萬。其中,引用量最高的研究便是他創造的 PPO 算法《Proximal policy optimization algorithms》。
他在加州大學伯克利分校獲得了計算機科學博士學位,導師為該校教授、深度強化學習大牛 Pieter Abbeel。之后從事機器人和強化學習研究與工作。在此之前,他還曾在伯克利短暫學習過神經科學,并在加州理工學院學習過物理學。
Aravind Srinivas-Perplexity (15B)
Aravind Srinivas 是一位印度裔美國計算機科學家、企業家,因聯合創立 AI 初創公司 Perplexity AI 而廣受關注。
2018 年,他在 OpenAI 實習并參與開發強化學習項目,師從 John Schulman。
2022 年,Srinivas 與 Denis Yarats、Johnny Ho 等人聯合創立了 Perplexity AI,擔任首席執行官。Perplexity AI 致力于打造世界上最值得信賴的問答引擎,其核心產品是一款基于大型語言模型的聊天機器人,能夠提供準確的答案和信息來源。
Aravind Srinivas 工作經歷也非常豐富,先后就職于谷歌 DeepMind、OpenAI 等明星公司。
Aravind Srinivas 在印度理工學院馬德拉斯分校(IIT Madras)完成了電氣工程碩士學位,專注于遷移學習和強化學習研究。隨后,他前往加州大學伯克利分校深造,獲得計算機科學博士學位,研究方向包括高效深度學習訓練方法和計算機視覺。
Deepak Pathak-Skild (4B)
Skild AI 是一家專注于機器人技術和人工智能應用的初創公司,成立于 2023 年 5 月,由 Deepak Pathak 和 Abhinav Gupta 創立。該公司致力于構建通用機器人智能。
Skild AI 開發了一款被稱為 Skild Brain 的可擴展機器人基礎模型,成為各種機器人在不同場景和任務中的通用大腦。這一模型能夠適應不同的硬件平臺和環境,從建筑工地到工廠,再到家庭等場景。去年 7 月,Skild AI 完成 3 億美元 A 輪融資,估值達到 15 億美元。此外,2025 年 1 月,有消息稱軟銀正在談判向 Skild AI 投資 5 億美元,其估值約為 40 億美元。
我們再回到 Deepak Pathak 本人。Deepak Pathak 博士畢業于加州大學伯克利分校,導師是 Alyosha Efros 和 Trevor Darrell 教授。他主要專注于計算機視覺、機器學習和機器人技術的交叉研究。
之前,Deepak Pathak 在 Meta AI 研究部門擔任了一年的研究員,并在加州大學伯克利分校以訪問博士后的身份與 Pieter Abbeel 合作。
Chelsea Finn, Sergey Levine-Pl (2.4B)
Physical Intelligence(簡稱 PI 或 π)是一家專注于開發基礎模型和學習算法的美國初創公司,目標是為當今的機器人和未來的物理驅動設備提供動力。
Chelsea Finn 是斯坦福大學計算機科學和電氣工程助理教授,也是 Pl 的聯合創始人。
之前,Chelsea Finn 在加州大學伯克利分校完成了計算機科學博士學位,并在麻省理工學院獲得了電氣工程和計算機科學學士學位。她還曾在谷歌大腦團隊工作過一段時間。
Sergey Levine 被認為是強化學習領域的領軍人物之一,他的谷歌學術引用量超過 17 萬。他也是 PI 的聯合創始人。
Sergey Levine 現在是加州大學伯克利分校電氣工程與計算機科學系副教授,專注于能夠使自主智能體通過學習獲得復雜行為的算法,特別是能夠使任何自主系統學習解決任何任務的通用方法。這類方法的應用包括機器人技術,以及需要自主決策的其他領域。
Sergey Levine 2009 年獲得了斯坦福大學碩士學位,2014 年獲斯坦福大學博士學位,2016 年加入加州大學伯克利分校電氣工程與計算機科學系。他的研究涉及自動駕駛、機器人、計算機視覺和圖形學。他的研究包括開發用于深度神經網絡的端到端訓練算法,用于逆向強化學習的可擴展算法,深度強化學習算法等。
Roshan Rao-Evolutionary Scale (x00M est.)
Roshan Rao 是 EvolutionaryScale 的聯合創始人兼研究科學家,致力于研究蛋白質的進化模型。此前他在 Meta AI 工作,并在加州大學伯克利分校完成了博士學位,導師是 John Canny 和 Pieter Abbeel。
EvolutionaryScale 是一家非盈利公司。他們的使命是通過與科學界合作以及開放、安全和負責任的研究,開發人工智能來理解生物學,造福人類健康和社會。自成立以來,ESM 項目一直致力于通過代碼和模型發布來開放科學,該團隊承諾將繼續堅持下去。該公司成立于 2023 年 7 月已經完成 1.42 億美元種子輪融資,并已經與亞馬遜(Amazon)和英偉達(NVIDIA)公司達成合作。
2024 年夏天,EvolutionaryScale 推出了 ESM3,一款面向蛋白質語言的大模型,成功在自然進化未曾涉足的區域設計出功能性蛋白,同期上線了該研究的預印版本。
時隔半年,該研究以「Simulating 500 million years of evolution with a language model」為題,于 2025 年 1 月 16 日在《Science》發布。
Aditya Grover-Inception Al (x00M est.)
Aditya Grover 是加州大學洛杉磯分校的計算機科學助理教授,領導機器智能 (MINT) 小組開發可以在有限監督下進行交互和推理的人工智能系統。
在加入 UCLA 之前,他曾在 FAIR 和 Meta 的核心機器學習團隊擔任研究科學家。此前他在加州大學伯克利分校度過了博士后生涯(導師為 Pieter Abbeel),在斯坦福大學完成了博士學位(導師為 Stefano Ermon,擴散模型的發明者之一),在印度理工學院德里分校完成了學士學位(聯合導師是 Mausam、Parag Singla)。
Aditya Grover 博士期間的導師 Stefano Ermon 于去年夏天創立了 Inception,并邀請他和康奈爾大學教授 Volodymyr Kuleshov 共同領導公司。
不久前, Inception 發布了首個商業級擴散大型語言模型(dLLM)Mercury,在英偉達 H100 上能以每秒超過 1000 token 的速度運行,性能媲美現有的經過速度優化的 LLM。基于來自 MidJourney 和 Sora 等圖像和視頻生成系統的靈感,Inception 為 Mercury 引入了一種新的語言生成方法。相比于現有的 LLM,這種方法的運行效率顯著更高(速度更快、成本更低),并且還可將推理成本降低 10 倍。
Peter Chen&Rocky Duan&Tianhao Zhang-Covariant (625M)
左一至左四:陳曦、Pieter Abbeel、段巖、張天浩
Covariant 是一家位于美國灣區的人工智能與機器人公司,致力于構建先進的人工智能模型,使機器人能夠觀察、推理和應對周圍的世界,從而支持多種不同的倉庫自動化任務。
公司成立于 2017 年,原名為 Embodied Intelligence,由 Pieter Abbeel、Peter Chen(陳曦)、Rocky Duan(段巖)和 Tianhao Zhang(張天浩) 創立。Pieter Abbeel 擔任首席執行官,Abbeel 擔任總裁兼首席科學家,段巖擔任首席技術官。
自 2008 年以來,Abbeel 一直擔任加州大學伯克利分校機器人學習實驗室主任,同時還是該校教授。三位創始人都是他在這所大學的學生。此外 Pieter Abbeel 和陳曦、段巖曾在 OpenAI 擔任研究員(當時 OpenAI 解散了機器人團隊),張天浩曾是微軟研究員。
在實驗室的研究基礎上,兩位創始人花了兩年多時間設計出 Covariant Brain,這是一款由人工智能驅動的軟件,可以為機械臂提供動力,使其能夠在倉庫中執行勞動。2018 年,該公司開始收集全球倉庫中 30 種機械臂的數據,所有這些機械臂都使用 Covariant Brain 運行。此后,該公司建立了一個包含數十億個現實世界機器人信息的數據庫。
2024 年 9 月,亞馬遜宣布聘用 Pieter Abbeel、Peter Chen 和 Rocky Duan 和 Covariant 約四分之一的員工,幫助推動 Covariant 技術在亞馬遜運營中的開發和實施,還簽署了使用 Covariant 機器人基礎模型的非獨家許可。
Misha Laskin-Reflection (555M)
Misha Laskin(左)和 Ioannis Antonoglou(右)
Misha Laskin 曾于 2022-2024 年任 Google DeepMind 研究科學家,此前曾在加州大學伯克利分校念博士后,是芝加哥大學理論物理學博士。他曾幫助開發谷歌 Gemini 大語言模型系列的訓練工作流程。
不久前,他宣布了自己已經成立一家名為 Reflection AI 的公司,旨在開發超級智能。公司一亮相,就已宣布獲得 1.3 億美元融資,估值更是高達 5.55 億美元。
除了擔任 CEO 的 Misha 之外,公司的聯合創始人 Ioannis 是谷歌 DeepMind 的創始工程師,也是 AlphaGo 的幕后功臣,還從事了 Gemini 的訓練后系統工作。其他團隊成員也都是曾在 DeepMind、OpenAI 和其他前沿實驗室發揮主導作用的研究人員和工程師,參與打造了過去十年間一些最先進的人工智能系統,比如 AlphaGo 和 Gemini 等。
Reflection 的愿景是構建超級智能代理來執行所有知識工作,這建立在兩個核心信念之上:
1. 自主編碼是邁向超級智能的關鍵一步。
2. 現實世界的評估 —— 而不僅僅是基準 —— 才是最重要的。
Jonathan Ho-ldeogram (500M est.)
Jonathan Ho 于 2020 年博士畢業,他曾與 Ajay Jain、Pieter Abbeel 聯合提出了去噪擴散概率模型(Denoising diffusion probabilistic models,DDRM)。
此后,他曾在谷歌擔任研究科學家,并在 2022 年 12 月共同創立了 Ideogram,開發文本生成圖像模型。公司利用深度學習技術將自然語言描述(即提示詞)轉化為數字圖像。與其他文本生成圖像模型相比,Ideogram 的獨特之處在于其能夠在生成的圖像中準確地呈現可讀的文字內容,這使其在創建包含文本元素的圖像(如標志、海報等)方面表現出色。
2024 年 8 月,公司發布了 Ideogram 2.0 模型,提供了現實主義、設計、3D 和動漫等多種風格,并進一步提升了在圖像中生成文本的能力。
自創立以來,Ideogram 完成了多輪融資,包括 2023 年 8 月的 1650 萬美元種子輪融資,該輪融資由 a16z 和 Index Ventures 領投;以及 Ideogram 1.0 發布后獲得由頂尖風險投資公司 a16z 領投的 8000 萬美元 A 輪融資。
Ajay Jain-Genmo
2023 年,Ajay Jain 博士畢業。博士期間,他的研究包括了機器學習(尤其是深度生成模型和表示學習)和計算機系統,學習了強化學習、無監督學習、計算機視覺、NLP、優化以及近似算法和系統方面的知識。
他是 DDPM 和 DreamFusion 的共同創建者。他們的工作為包括 Stable Diffusion 和 DALL-E 2 在內的所有現代擴散模型奠定了基礎。
他曾在 Google Brain 工作,創建了首個文本到 3D 生成模型。2022 年 12 月,他共同創立了 Genmo AI 并擔任 CTO,這是一家專注于視頻生成的 AI 公司。
2024 年 10 月,Genmo 推出了 Mochi 1 開源視頻生成模型的研究預覽版本,可以實現高保真運動和強大實時性,尤其在遵循用戶詳細指令方面做得很好。
Ariun Singh-Gradescope
Arjun Singh 于 2016 年博士畢業。
2014 年,Arjun Singh 與 Pieter Abbeel、Sergey Karayev(另一位博士)共同創立了 Gradescope,一款利用人工智能輔助教師評分的工具。
圖源:從左到右依次為 Gradescope 聯合創始人 Pieter Abbeel、Arjun Singh 和 Sergey Karayev。
根據 Crunchbase 的信息,Gradescope 已完成多輪融資,投資方包括 Khosla Ventures、Reach Capital 和 Gradient Ventures 等知名機構。不過,具體的融資金額和輪次并未公開披露。
值得注意的是,2018 年,Gradescope 被 Turnitin 收購。此后,Gradescope 繼續作為 Turnitin 旗下的產品運營,致力于為教育工作者提供高效的批改和反饋工具。
Philipp Wu&Fred Shentu-Stealth
Philipp Wu 現為 Pieter Abbeel 的博士生(2021 年 8 月到 2026 年 5 月)。他的研究興趣在于現實世界的通用機器人,研究涉及到了強化學習、無監督學習和機器人技術的交叉融合。
他在 Pieter Abbeel 負責的機器人學習實驗室(Robot Learning Lab)工作,內容包括創建低成本、對人類安全、7 自由度的柔性機械臂,被稱為「Blue」,應用包括輔助家庭護理、深度強化學習、模仿學習和抓取。此外,他還研發了一個機器人動力學和運動學模型以及一個用于測試控制算法的「Gazebo」模擬器,等等。
Yide (Fred) Shentu 現為 Pieter Abbeel 的博士生。他本科同樣就讀于加州大學伯克利分校,主修專業為物理以及數學和計算機科學。本科期間,他曾在 BAIR(伯克利人工智能研究實驗室)擔任研究助理。本科畢業后,他曾擔任機器人公司 Covariant AI 的創始工程師和研究科學家。
目前,關于 stealth 的信息不多。