斯坦福李飛飛首次創(chuàng)業(yè):學(xué)術(shù)休假兩年,瞄準「空間智能」
沒想到,在大模型時代,知名「AI 教母」李飛飛也要「創(chuàng)業(yè)」了,并完成了種子輪融資。
據(jù)路透社獨家報道,著名計算機科學(xué)家李飛飛正在創(chuàng)建一家初創(chuàng)公司。該公司利用類似人類的視覺數(shù)據(jù)處理方式,使人工智能能夠進行高級推理。
知情人士透露稱,李飛飛最近為這家公司進行了種子輪融資,投資者包括硅谷風(fēng)險投資公司 Andreessen Horowitz,以及她去年加入的加拿大公司 Radical Ventures。
不過,Andreessen Horowitz 和 Radical Ventures 的發(fā)言人均對此保持沉默,李飛飛也未作回應(yīng)。
休假兩年
李飛飛被譽為「人工智能教母」,此稱號源自「人工智能教父」稱謂,通常用來致敬三位在計算機科學(xué)領(lǐng)域取得卓越成就的開拓者 —— 杰弗里?辛頓(Geoffrey Hinton)、約書亞?本吉奧(Yoshua Bengio)和楊立昆(Yann LeCun)。他們因在 AI 技術(shù)方面的突破于 2018 年獲得計算機界的最高獎項圖靈獎。
李飛飛的成名作是開發(fā)了一個名為 ImageNet 的大規(guī)模圖像數(shù)據(jù)集,該數(shù)據(jù)集幫助開創(chuàng)了第一代能夠可靠識別物體的計算機視覺技術(shù)。李飛飛還是斯坦福大學(xué)以人為中心人工智能研究所(Human-Centered AI Institute)的聯(lián)合主任。該所專注于以 「改善人類狀況」 的方式發(fā)展 AI 技術(shù)。除了學(xué)術(shù)工作外,李飛飛在 2017 年至 2018 年期間領(lǐng)導(dǎo)了谷歌云的 AI 部門,擔任過 Twitter 董事會成員。
李飛飛曾對人工智能研究方面存在的資金缺口表示遺憾。她指出,盡管私營部門資源豐富,但學(xué)術(shù)界和政府實驗室的資金支持仍捉襟見肘。她呼吁美國政府拿出「登月思維」,投資于這項技術(shù)的科學(xué)應(yīng)用及其風(fēng)險研究。
據(jù)李飛飛的斯坦福簡歷顯示,她從 2024 年初到 2025 年底處于「Partial Leave」狀態(tài)。她的研究興趣涵蓋了「認知啟發(fā)的 AI」、「計算機視覺」和「機器人學(xué)習(xí)」等領(lǐng)域。
在職業(yè)社交網(wǎng)站領(lǐng)英上,李飛飛將自己的當前工作狀態(tài)描述為「新手」和「新事物」,從 2024 年 1 月開始。
此次創(chuàng)業(yè),李飛飛卷入了最熱門的 AI 公司之間的競爭:教導(dǎo)算法具備常識,以克服當前技術(shù)的局限性,如大語言模型可能產(chǎn)生的幻覺。許多人認為,這種「推理」能力必須先建立起來,然后人工智能模型才能實現(xiàn)通用人工智能(AGI),即系統(tǒng)能夠像人類一樣或更勝一籌地執(zhí)行大多數(shù)任務(wù)。
一些研究人員認為,他們可以通過構(gòu)建更大、更復(fù)雜的模型來提高推理能力,而其他人則認為,未來的道路涉及使用新的「世界模型」,這些模型可以吸收來自周圍物理環(huán)境的視覺信息,以發(fā)展邏輯,復(fù)制嬰兒的學(xué)習(xí)方式。
創(chuàng)業(yè)方向:空間智能
那么李飛飛具體的創(chuàng)業(yè)方向是什么?
在介紹這家初創(chuàng)公司時,一位消息人士引用了李飛飛上個月在溫哥華 TED 會議上的一次演講。她在演講中表示,該前沿的研究涉及一種可以合理地推斷出圖像和文字在三維環(huán)境中的樣子的算法,并根據(jù)這些預(yù)測采取行動,這種算法概念叫做「空間智能」。
為了進一步解釋「空間智能」這一概念,她展示了一張貓伸出爪子將玻璃杯推向桌子邊緣的圖片。她表示,在一瞬間,人類大腦可以評估「這個玻璃杯的幾何形狀,它在三維空間中的位置,它與桌子、貓和所有其他東西的關(guān)系」,然后預(yù)測會發(fā)生什么,并采取行動加以阻止。
她說:「大自然創(chuàng)造了一個以空間智能為動力的觀察和行動的良性循環(huán)。」她還補充說,她所在的斯坦福大學(xué)實驗室正在嘗試教計算機「如何在三維世界中行動」,例如,使用大型語言模型讓一個機械臂根據(jù)口頭指令執(zhí)行開門、做三明治等任務(wù)。
這讓人聯(lián)想到2023年李飛飛公布的研究VoxPoser以及VIMA 機器人智能體。
VoxPoser將大模型接入機器人,可在無需額外數(shù)據(jù)和訓(xùn)練的情況下,將復(fù)雜指令轉(zhuǎn)化為具體的行動。
而VIMA 智能體能像 GPT-4 一樣接受多模態(tài)的(文本、圖像、視頻或它們的混合 )Prompt 輸入,然后輸出動作,完成指定任務(wù)。
我們也可以進一步回顧李飛飛近期的一些其他相關(guān)研究。例如,今年1月份,李飛飛在 X 上推廣了一篇有關(guān) 3D 人體渲染工作的新進展 —— 一種名為 Wild2Avatar 的新模型,該模型即使在有遮擋的情況下仍然能夠完整、高保真地渲染人體。
在此之前,李飛飛領(lǐng)導(dǎo)的一個多學(xué)科聯(lián)合團隊也曾發(fā)表研究,提出了一種通用型的智能 BRI 系統(tǒng) NOIR(Neural Signal Operated Intelligent Robots / 神經(jīng)信號操控的智能機器人),可以腦控機器人做家務(wù),例如烹飪、熨衣服、玩游戲等。
期待李飛飛的創(chuàng)業(yè)公司,能為 AI 社區(qū)帶來新的驚喜。