斯坦福李飛飛首次創(chuàng)業(yè)：學(xué)術(shù)休假兩年，瞄準「空間智能」

作者：機器之心 2024-05-06 07:10:00

據(jù)路透社獨家報道，著名計算機科學(xué)家李飛飛正在創(chuàng)建一家初創(chuàng)公司。該公司利用類似人類的視覺數(shù)據(jù)處理方式，使人工智能能夠進行高級推理。

沒想到，在大模型時代，知名「AI 教母」李飛飛也要「創(chuàng)業(yè)」了，并完成了種子輪融資。

知情人士透露稱，李飛飛最近為這家公司進行了種子輪融資，投資者包括硅谷風(fēng)險投資公司 Andreessen Horowitz，以及她去年加入的加拿大公司 Radical Ventures。

不過，Andreessen Horowitz 和 Radical Ventures 的發(fā)言人均對此保持沉默，李飛飛也未作回應(yīng)。

休假兩年

李飛飛被譽為「人工智能教母」，此稱號源自「人工智能教父」稱謂，通常用來致敬三位在計算機科學(xué)領(lǐng)域取得卓越成就的開拓者 —— 杰弗里?辛頓（Geoffrey Hinton）、約書亞?本吉奧（Yoshua Bengio）和楊立昆（Yann LeCun）。他們因在 AI 技術(shù)方面的突破于 2018 年獲得計算機界的最高獎項圖靈獎。

李飛飛的成名作是開發(fā)了一個名為 ImageNet 的大規(guī)模圖像數(shù)據(jù)集，該數(shù)據(jù)集幫助開創(chuàng)了第一代能夠可靠識別物體的計算機視覺技術(shù)。李飛飛還是斯坦福大學(xué)以人為中心人工智能研究所（Human-Centered AI Institute）的聯(lián)合主任。該所專注于以「改善人類狀況」的方式發(fā)展 AI 技術(shù)。除了學(xué)術(shù)工作外，李飛飛在 2017 年至 2018 年期間領(lǐng)導(dǎo)了谷歌云的 AI 部門，擔任過 Twitter 董事會成員。

李飛飛曾對人工智能研究方面存在的資金缺口表示遺憾。她指出，盡管私營部門資源豐富，但學(xué)術(shù)界和政府實驗室的資金支持仍捉襟見肘。她呼吁美國政府拿出「登月思維」，投資于這項技術(shù)的科學(xué)應(yīng)用及其風(fēng)險研究。

據(jù)李飛飛的斯坦福簡歷顯示，她從 2024 年初到 2025 年底處于「Partial Leave」狀態(tài)。她的研究興趣涵蓋了「認知啟發(fā)的 AI」、「計算機視覺」和「機器人學(xué)習(xí)」等領(lǐng)域。

在職業(yè)社交網(wǎng)站領(lǐng)英上，李飛飛將自己的當前工作狀態(tài)描述為「新手」和「新事物」，從 2024 年 1 月開始。

此次創(chuàng)業(yè)，李飛飛卷入了最熱門的 AI 公司之間的競爭：教導(dǎo)算法具備常識，以克服當前技術(shù)的局限性，如大語言模型可能產(chǎn)生的幻覺。許多人認為，這種「推理」能力必須先建立起來，然后人工智能模型才能實現(xiàn)通用人工智能（AGI），即系統(tǒng)能夠像人類一樣或更勝一籌地執(zhí)行大多數(shù)任務(wù)。

一些研究人員認為，他們可以通過構(gòu)建更大、更復(fù)雜的模型來提高推理能力，而其他人則認為，未來的道路涉及使用新的「世界模型」，這些模型可以吸收來自周圍物理環(huán)境的視覺信息，以發(fā)展邏輯，復(fù)制嬰兒的學(xué)習(xí)方式。

創(chuàng)業(yè)方向：空間智能

那么李飛飛具體的創(chuàng)業(yè)方向是什么？

在介紹這家初創(chuàng)公司時，一位消息人士引用了李飛飛上個月在溫哥華 TED 會議上的一次演講。她在演講中表示，該前沿的研究涉及一種可以合理地推斷出圖像和文字在三維環(huán)境中的樣子的算法，并根據(jù)這些預(yù)測采取行動，這種算法概念叫做「空間智能」。

為了進一步解釋「空間智能」這一概念，她展示了一張貓伸出爪子將玻璃杯推向桌子邊緣的圖片。她表示，在一瞬間，人類大腦可以評估「這個玻璃杯的幾何形狀，它在三維空間中的位置，它與桌子、貓和所有其他東西的關(guān)系」，然后預(yù)測會發(fā)生什么，并采取行動加以阻止。

她說：「大自然創(chuàng)造了一個以空間智能為動力的觀察和行動的良性循環(huán)。」她還補充說，她所在的斯坦福大學(xué)實驗室正在嘗試教計算機「如何在三維世界中行動」，例如，使用大型語言模型讓一個機械臂根據(jù)口頭指令執(zhí)行開門、做三明治等任務(wù)。

這讓人聯(lián)想到2023年李飛飛公布的研究VoxPoser以及VIMA 機器人智能體。

VoxPoser將大模型接入機器人，可在無需額外數(shù)據(jù)和訓(xùn)練的情況下，將復(fù)雜指令轉(zhuǎn)化為具體的行動。

而VIMA 智能體能像 GPT-4 一樣接受多模態(tài)的（文本、圖像、視頻或它們的混合）Prompt 輸入，然后輸出動作，完成指定任務(wù)。

我們也可以進一步回顧李飛飛近期的一些其他相關(guān)研究。例如，今年1月份，李飛飛在 X 上推廣了一篇有關(guān) 3D 人體渲染工作的新進展 —— 一種名為 Wild2Avatar 的新模型，該模型即使在有遮擋的情況下仍然能夠完整、高保真地渲染人體。

在此之前，李飛飛領(lǐng)導(dǎo)的一個多學(xué)科聯(lián)合團隊也曾發(fā)表研究，提出了一種通用型的智能 BRI 系統(tǒng) NOIR（Neural Signal Operated Intelligent Robots / 神經(jīng)信號操控的智能機器人），可以腦控機器人做家務(wù)，例如烹飪、熨衣服、玩游戲等。

期待李飛飛的創(chuàng)業(yè)公司，能為 AI 社區(qū)帶來新的驚喜。

責任編輯：張燕妮來源：機器之心

李飛飛智能空間

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

斯坦福李飛飛首次創(chuàng)業(yè)：學(xué)術(shù)休假兩年，瞄準「空間智能」

休假兩年

創(chuàng)業(yè)方向：空間智能