剛剛,北大校友Lilian Weng自曝公司首個產(chǎn)品?一篇論文未發(fā),估值卻已90億
OpenAI前研究員大佬、如今的Thinking Machines Lab聯(lián)創(chuàng)Lilian Weng,剛剛轉發(fā)了一個神秘產(chǎn)品——一個看似儀表盤的東西。
或許,這就將是公司即將打造的第一個爆品?
這個產(chǎn)品所揭示的理念,可謂十分驚人——
在訓練過程中,研究人員可以直接用它來手動調(diào)整所有的超參數(shù)了!
Lilian Weng宣稱:總有一天我們會涉足硬件領域,而現(xiàn)在就是時候了。
所以,這個最高估值90億美元神秘新公司的首個產(chǎn)品,或許就是這個硬件?
前CTO組建的神秘公司,
憋的大招是這個?
其實,分享出這個視頻的,是前谷歌DeepMind員工Stephen Roller,后來,他又跳到了Character AI,現(xiàn)在來到了Thinking Machines Lab。
他表示,一些團隊需要通過參數(shù)遍歷、啟發(fā)式方法或者Scaling Law來確定訓練的學習率。
但是在Character,他們只需要讓Noam Shazeer來手動調(diào)到正確的值。
這位Noam Shazeer,就是出走谷歌后創(chuàng)辦Character,又讓谷歌豪擲27億刀買下整個初創(chuàng)、只為換得他重回谷歌工作的那位大神。
這個idea,著實讓開發(fā)者們興奮了。
看起來,這似乎比大多數(shù)調(diào)度方法都要好。
有人問道,為什么在這個過程中,還需要繪制學習率的平均值呢?
Stephen Roller回答說:「并不一定。對于所有指標,我們都會跟蹤平均值和分母。對于學習率(LR),分母始終為1。這只是我們模板的一個副作用。」
有人表示,這個方法看起來太贊了!不過,仍然會需要做很多超參數(shù)搜索。
而且,他還發(fā)現(xiàn)了一件事,就是很多人在訓練出不錯的模型但達到瓶頸后,通常不會嘗試分支搜索,即不會把這個模型衍生出幾個不同學習率的訓練路徑。
但其實,如果提前主動剪掉一些沒前途的分枝,其實是能節(jié)省不少算力的。
另外還有一名Character員工爆料說,其實在實踐中,你需要花費大量的計算資源和精力,才能超越Noam隨口提出的超參數(shù)。莫非,這是大神獨有的一種神秘手動天賦?
「或許未來,AI研究中心會類似于老式發(fā)電廠的控制室?」
還有人玩起了梗:以后訓大模型會是這樣的,把實驗接到DJ混音器上,然后開始憑感覺微調(diào)超參數(shù)?
一篇論文未發(fā),已經(jīng)估值90億
神秘的Thinking Machines Lab,由Murati牽頭,網(wǎng)羅了一堆OpenAI的天才核心員工。
雖然一篇論文未發(fā),但公司的估值已經(jīng)達到了驚人的90億美元。
現(xiàn)在,公司旗下的大神包括但不限于——
Lilian Weng,OpenAI前研究副總裁(VP of Research),主管模型安全。
OpenAI聯(lián)創(chuàng)John Schulman,主導了ChatGPT的研發(fā)工作;2022至2024年間,共同負責為ChatGPT和OpenAI API開發(fā)核心模型架構。
ChatGPT共同創(chuàng)始人Barret Zoph,OpenAI前研究副總裁,主管后期訓練方向。
GPT開山一作、「愛因斯坦級天才」Alec Radford,「史上最強本科學歷AI研究員」。
OpenAI首席研究官,塑造GPT-3、GPT-4、o1的關鍵人物Bob McGrew。
OpenAI前多模態(tài)團隊負責人Alexander Kirillov。
現(xiàn)在,Thinking Machines的網(wǎng)站上列出了38名創(chuàng)始團隊成員,其中有19人都是OpenAI的老員工,還有多位華人科學家。
在表面上,Thinking Machines這塊調(diào)參「DJ臺」看起來只是一個極客味十足的訓練工具;但如果放到更宏大的產(chǎn)業(yè)棋局中,它的意義遠不止于此——
它揭開了下一場AI大戰(zhàn)的序幕:一場關于「誰能占據(jù)AI硬件入口」的全新較量。
另一邊,OpenAI也早已悄悄布局。
就在不久前曝光的一份內(nèi)部文件中,它寫得清清楚楚——
ChatGPT的未來,不只是網(wǎng)頁和APP,而是一種「無處不在、永不離線」的全新硬件形態(tài)。
OpenAI:AI+硬件的野心被挖出
在2024年12月2日,OpenAI的一份內(nèi)部文件,提到「Ship a [REDACTED] by 2026」。
這些文件來自美國司法部訴谷歌壟斷案(U.S. v. Google (2024) (1:20-cv-03010)),基本上就是真材實料,因為涉及到具體的商業(yè)機密,所以關鍵部分做了處理。
OpenAI在文件中坦言:網(wǎng)站、手機、桌面應用,仍無法讓ChatGPT「無處不在」。
他們設想的,是能融入家庭、街道、職場、獨處時刻的全能AI硬件。
被打碼的極有可能是一款硬件設備。
ChatGPT翻譯的OpenAI內(nèi)部文件大意:
在2026年前推出一款██████████
如今,ChatGPT已通過我們的網(wǎng)站、手機和桌面應用的形式出現(xiàn)在生活中。但我們對ChatGPT的愿景,是讓它無論你身在何處,都能陪伴你的整個生活。
在家中,它應該能幫你解答問題、播放音樂、推薦食譜;在路上,它應該能幫你導航、尋找最棒的餐廳、聯(lián)絡朋友;在工作中,它應該能幫你做會議記錄或準備重要演講;而在獨自行走時,它應該能陪你思考、放松心情。
我們希望ChatGPT成為█████████████████████████████████████████████。
最好的AI,是那個始終陪伴在你身邊的AI。
ChatGPT還給出了合理猜測:OpenAI要發(fā)布個人AI設備,他們希望ChatGPT成為實時響應、無處不在、始終陪伴的AI助手。
它還給出了依據(jù)說明:
這都說得通:什么東西能「始終陪伴」?
因為手機已經(jīng)被排除,智能手表之類的硬件是個可能的選擇。
在曝料貼下,網(wǎng)友Gordon Sloane還上傳了帶有OpenAI商標的設備。
最近,OpenAI還收購了知名硬件設計師Jony Ive的設計工作室LoveFrom,意在智能設備。
根據(jù)OpenAI發(fā)布的新聞,早在兩年前,Jony Ive的創(chuàng)意團隊LoveFrom悄然開始與OpenAI團隊展開合作。
為了探索更多AI工具與產(chǎn)品形態(tài),一年前,Jony Ive聯(lián)合Scott Cannon、Evans Hankey與Tang Tan創(chuàng)立了io設計公司。
左:Jony Ive;中:Evans Hankey;右:Tang Tan
在本月,OpenAI宣布用64億美元收購io團隊。
Jony Ive曾擔任蘋果公司的首席設計官(chief design officer),主管產(chǎn)品設計和人機界面設計。
OpenAI顯然在效仿Apple,試圖以Jony Ive的美學重塑AI硬件體驗,押注屬于AI時代的下一個「iPhone時刻」。
而那些被挖出的內(nèi)部文件,無疑也在佐證OpenAI謀劃多時,意在智能硬件的目標絕非一時起意。