奧特曼采訪回應(yīng)“偷走”吉卜力!GPT4o大爆炸;套殼OpenAI也能成為大生意;今年AI可以幫編程提效10倍! 原創(chuàng)
整理 | 伊風(fēng)
出品 | 51CTO技術(shù)棧(微信號:blog51cto)
剛剛,奧特曼又有了一個新采訪!干貨滿滿。
在這場訪談中,OpenAI CEO 奧特曼接受了印度博主兼開發(fā)者 Varun Mayya 的專訪,聊到了多個當(dāng)前 AI 技術(shù)從業(yè)者最關(guān)心的話題:包括最近火爆出圈的 GPT-4o 圖像生成能力、Prompt Engineer 是否真的值得存在、Agent 的落地路徑等等,甚至還有他本人對 AI 帶來失業(yè)焦慮的思考。
畫個重點,本次采訪亮點有:
- GPT-4o爆火,“現(xiàn)在生成的圖像數(shù)量遠(yuǎn)遠(yuǎn)超過了我原本以為互聯(lián)網(wǎng)有的需求。我們很快就會突破十億張總圖像的里程碑。”
- 談到“一鍵生成吉卜力”、宮崎駿"反對AI”的爭議話題,奧特曼表示AI會帶來內(nèi)容創(chuàng)作的民主化。“當(dāng)然,它也帶來一些負(fù)面影響,也確實改變了藝術(shù)形式本身。但從整體來看,這是進(jìn)步。”
- “套殼”也會產(chǎn)生了不起的生意,OpenAI也是從這種貶低中成長起來的“他們說你們不過是個小研究實驗室,遲早會被 Google 碾壓。你們只是把點子包裝一下,真正的價值會被視頻平臺拿走、被大公司搶走。”
- 對于編程自動化問題,重要的是“提效”而非AI完全接管編程工作:“你說完全 100% 自動化,能構(gòu)建一個復(fù)雜系統(tǒng)而完全不碰代碼——這是一種情況。但我更關(guān)注的是“程序員效率提升10倍”這種事情。我認(rèn)為今年或明年就可能發(fā)生。”
- 不過,編程仍然是OpenAI的Agent瞄準(zhǔn)的方向。奧特曼表示,“代碼領(lǐng)域?qū)蔀橐粋€重要突破口。”
以下是經(jīng)過整理的播客訪談全文,為了方便閱讀,順序略微調(diào)整:
GPT-4o大爆:我們即將突破十億張總圖像生成里程碑
主持人:女士們先生們,我現(xiàn)在與 Sam Altman 在一起。Sam,最近我看到你發(fā)了不少推文。他們以前叫“posts”,現(xiàn)在又改叫“Xs”。我都不知道現(xiàn)在該叫什么了。
奧特曼:我也不知道他們現(xiàn)在叫啥。
主持人:反正你最近發(fā)了不少關(guān)于印度的內(nèi)容,也發(fā)了很多關(guān)于新版圖像生成的內(nèi)容。首先我得說,我有幸提前試用了那個圖像生成工具,真的非常棒。從情緒板制作、生成圖片、到UI設(shè)計,體驗都非常出色。而且這個工具還很智能。
我們做了個特別聰明的用例——我們讓它生成一個3D模型的正面圖,然后再讓它生成左側(cè)視角、右側(cè)視角和背面視角,再把這些圖像扔進(jìn)另一個模型中生成網(wǎng)格,并把這些貼圖重新映射上去。我們甚至還能讓它生成高度圖。想想幾個月前這些還不存在,現(xiàn)在居然做到了,真的太震撼了。現(xiàn)在的用戶反響如何?有沒有什么數(shù)據(jù)可以分享?
奧特曼:我不確定能不能分享具體數(shù)字,但我可以說,我們現(xiàn)在生成的圖像數(shù)量遠(yuǎn)遠(yuǎn)超過了我原本以為互聯(lián)網(wǎng)有的需求。我們很快就會突破十億張總圖像的里程碑。
主持人:哇哦,那可是個巨大的數(shù)字。你有沒有看到什么特別有創(chuàng)意的用法?除了把自己變成動漫風(fēng)之外。
奧特曼:讓我覺得特別興奮的是各種各樣的創(chuàng)意用例。當(dāng)然,最開始火起來的是把自己變成動漫角色,但后來我看到人們創(chuàng)造了很多我以前完全沒想過的新類型圖像,真的很驚喜。當(dāng)然,也有很多很棒的商業(yè)用途,比如小企業(yè)用它來做新Logo、平面設(shè)計等等。但最打動我的是那種純粹的創(chuàng)造力——人們用它做出了前所未有的圖像,這真的讓我很激動。
GPT-4o會讓設(shè)計類工作走向消亡嗎?——還未可知,但會有新工作
主持人:太棒了。我還想聊聊另一個方面,就是UI和設(shè)計類工作。我們原本以為這些工具一發(fā)布,就能代替我們完成大部分工作。但實際上,在我們公司,我們還有很多視頻剪輯師和平面設(shè)計師。結(jié)果發(fā)現(xiàn)我們還是需要人來操作這些工具——因為人類仍然需要負(fù)責(zé)任,需要維持上下文,某種程度上相當(dāng)于這些工具的“經(jīng)理”。你覺得這就是工作的演變路徑嗎?你有沒有觀察到類似現(xiàn)象?或者說你對未來工作的變化有怎樣的看法?
奧特曼:我覺得這會因職業(yè)而異,有些工作可能會完全消失,由AI端到端完成。但大多數(shù)情況是,人們有了新工具后,工作效率更高、質(zhì)量更好。比如,依然會有人負(fù)責(zé)讓網(wǎng)站看起來很棒,只不過大家對網(wǎng)站“好看”的期待會提升,結(jié)果是我們所有人都能看到更好的成果。也許內(nèi)容產(chǎn)出還會變多,在這樣的世界中,對這類工作的需求可能會更高。然后還會出現(xiàn)一些全新的職業(yè),這是我們現(xiàn)在還沒見過的。
主持人:你現(xiàn)在有沒有一些例子?
奧特曼:比如一些客戶支持類的工作,我認(rèn)為AI已經(jīng)能端到端完成了,那屬于我剛才提到的第一類。至于第二類——我們剛剛在說的平面設(shè)計師的例子——審美仍然非常重要。
你知道的,平面設(shè)計師以前用紙筆做設(shè)計,后來有了電腦工具,他們能做得更多、更好。我們?nèi)匀恍枰獌?yōu)秀的平面設(shè)計。現(xiàn)在我們又有了新工具,它顯然會改變設(shè)計師的工作流程,一些原本有人付錢的任務(wù),現(xiàn)在可能不會再有人付錢。
在我看來,未來依然會有“讓這個網(wǎng)站好看”的崗位,也許從業(yè)人數(shù)減少了,但他們收入更高;又或者從業(yè)人數(shù)變多了,因為我們突然能做出更多網(wǎng)站了。也許這個世界原本對平面設(shè)計的需求就遠(yuǎn)比我們承受得起的高——這方面我們現(xiàn)在還不好說。
還有一種是全新的工作類型,第一個例子就是“Prompt Engineer(提示工程師)”。在AI出現(xiàn)之前,根本不存在這個職位。甚至很難想象有這么一種職業(yè)。現(xiàn)在有很多這樣的例子,但這個對我來說最親切。
主持人:確實很有意思,每當(dāng)這些新職業(yè)出現(xiàn)時,總是先被人嘲笑。比如那些做“套殼”(rapper)的人,我們后面會聊到。就算是“提示工程師”,很多人現(xiàn)在也不當(dāng)回事。大家覺得只是寫寫英文而已。你會為這個職業(yè)辯護(hù)嗎?有沒有什么方法能讓這些剛進(jìn)入這個領(lǐng)域的人不覺得自己在“掉價”?
奧特曼:我小時候就知道我想學(xué)計算機編程,可是我身邊的大人都說,那就是個愛好,不是正經(jīng)職業(yè)。那時候他們覺得電腦沒前途,非得去當(dāng)醫(yī)生、律師這種“穩(wěn)定職業(yè)”才算正經(jīng)。他們覺得學(xué)編程是條危險的路。但我當(dāng)時覺得我理解了一些他們不懂的事。我真心鼓勵大家相信自己的判斷——就算某個工作在過去不是高地位、被認(rèn)可的,也不代表它將來不會變得有價值。這就是科技進(jìn)步的方式。
主持人:你以前寫過一篇博文,叫《被誤解的勇氣》(The Strength to Be Misunderstood),我超喜歡那篇。那篇文章真幫了我很多。你是很多年前寫的,我當(dāng)時剛決定做內(nèi)容創(chuàng)作者,那時候這個職業(yè)地位也不高。
奧特曼:說到你的工作,我記得大概十年前吧,我會去和年輕人聊創(chuàng)業(yè)。我喜歡問他們覺得哪些行業(yè)最有意思,因為年輕人的觀點往往不一樣,而且往往是對的。當(dāng)時很多人說他們想做YouTuber。我當(dāng)時一臉懵逼,心想:啥?但那一刻我意識到:我不能像別人以前否定程序員那樣,去否定他們。
正面回應(yīng)宮崎駿反對AI創(chuàng)作事件:內(nèi)容創(chuàng)作的門檻降低是好事
主持人:我還想提另一個最近在網(wǎng)上爭議比較大的話題:宮崎駿的那個視頻。那個視頻當(dāng)然是被斷章取義了——他在看一個很早期的模型動畫,一個怪物在扭動,他說“我不喜歡這個”。作為一個從業(yè)幾十年的藝術(shù)家,我能理解他的感受。我們創(chuàng)作圖像或視頻的過程,曾經(jīng)需要付出大量努力,現(xiàn)在卻變得簡單多了,有時反而有點失落。
作為藝術(shù)家,這種變化多少有點讓人沮喪。但作為一個創(chuàng)業(yè)者,要養(yǎng)團(tuán)隊、發(fā)工資,我又覺得這項技術(shù)非常有價值,它幫我提升了效率,減輕了壓力。你怎么看藝術(shù)的變化?我們該如何看待它?
奧特曼:想象一下三十年前你想做你現(xiàn)在做的事情,那幾乎是不可能的。你需要一個攝像機、VHS錄像帶,還得想辦法剪輯,這些步驟都很復(fù)雜。就算完成了,還得自己去分發(fā)錄像帶,因為當(dāng)時還沒有YouTube,網(wǎng)絡(luò)也很差。但現(xiàn)在,世界上任何人只要有一部智能手機,就能拍攝并上傳視頻。如果他說的內(nèi)容有趣,全世界都能看到并受益。
我認(rèn)為內(nèi)容創(chuàng)作的民主化對社會是個巨大好處。當(dāng)然,它也帶來一些負(fù)面影響,也確實改變了藝術(shù)形式本身。但從整體來看,這是進(jìn)步。我非常相信科技的力量,它可以賦予所有人更多工具,降低門檻,讓更多人有能力為社會做貢獻(xiàn),最終大家都能從中獲益。是的,它可能會導(dǎo)致一些工作消失,也讓原本憑技能吃飯的人面臨更多競爭。但總體來說,這是社會的福祉。
我自己的親身經(jīng)歷是看到創(chuàng)業(yè)門檻的變化。以前創(chuàng)業(yè)需要很多資金和資源,但后來這些門檻都被削弱了,特別是像 AWS 的出現(xiàn),這是其中最重要的轉(zhuǎn)折點之一。
另一個大變化就是互聯(lián)網(wǎng)的普及。再加上 Y Combinator 從 2005 年起所推動的一種潮流——年輕、有技術(shù)背景的創(chuàng)始人突然可以更容易地創(chuàng)辦公司了。這帶來了大量的新產(chǎn)品和新技術(shù),造福了整個世界。當(dāng)然,被這些公司競爭掉的傳統(tǒng)企業(yè)可能不太高興。但從世界公民的角度來說,我們確實擁有了更多可能性。OpenAI 本身也是一個例子——我們這個小團(tuán)隊能做出這樣的事,只是因為技術(shù)棧的準(zhǔn)入門檻大大降低了。
我同意,特別是像 Stripe 出現(xiàn)之后,還有在印度,UPI 的普及,讓新的公司、新的產(chǎn)品激增。以前很多事因為繁瑣的流程根本做不起來。我猜設(shè)計領(lǐng)域現(xiàn)在也開始出現(xiàn)類似的變化。
套殼OpenAI也能獲得成功,重要的是走自己的創(chuàng)業(yè)路
主持人:說到 Y Combinator,我想請你戴上“20歲版本的你”的帽子——假設(shè)你回到當(dāng)年,知道現(xiàn)在所有的一切,有人勸你別去做“GPT套殼”(rapper),因為 OpenAI 遲早會干掉你;也有人說基礎(chǔ)模型沒用,套殼才是能賺錢、能融資的東西。在這樣的辯論下,你會怎么做?
奧特曼:你只是在做套殼”這種說法,其實以前在別的領(lǐng)域也常見。有人也說過,“你只是建立在 AWS 上的一個套殼”,類似的評論也不少。
但現(xiàn)在,人們基于 AI 正在建立非常了不起的新公司。大多數(shù)公司會失敗,或者發(fā)展一般,但有些會找到持久的商業(yè)模式,創(chuàng)造巨大的價值。這一直都是世界的運行方式——大多數(shù)初創(chuàng)公司都會失敗,但少數(shù)成功的會極其成功。所以,把所有東西都簡單 dismiss 掉,說它們只是套殼,聽起來好像很聰明,但實際上完全錯了。我記得人們以前對 OpenAI 也有類似的說法。
主持人:他們當(dāng)時都說了啥?
奧特曼:他們說你們不過是個小研究實驗室,遲早會被 Google 碾壓。你們只是把點子包裝一下,真正的價值會被視頻平臺拿走、被大公司搶走。這些話還是一兩年前說的。我覺得,有些話聽起來酷又老練,像是能看透一切。但要建立偉大的公司或投資它們,最關(guān)鍵的一課是:不要被這種“偽聰明”的觀點帶偏。所以如果我是現(xiàn)在在 YC 的 20 歲年輕人,有人說我做的是 GPT 套殼,我反而會覺得:嘿,我可能走在了正確的方向上。
主持人:那你有沒有具體的想法?如果你不是在 OpenAI,而是一個普通創(chuàng)業(yè)者,手上有 50 萬美元,你會做什么?
奧特曼:出于原則,我一般不回答這種問題。因為我最在意的是:大家不要去復(fù)制別人的創(chuàng)業(yè)點子。
我自己想出來的創(chuàng)業(yè)點子,說不定都挺“平庸”的。而某個現(xiàn)在正在寫代碼的 20 歲年輕人,提出一個聽起來荒謬又“爛透了”的想法,說不定那才是下一個 OpenAI。我不希望我拋出一個“中規(guī)中矩、與現(xiàn)實脫節(jié)”的想法,讓別人因此放棄自己瘋狂又獨特的創(chuàng)意。所以我的建議是:去做你那個瘋狂的點子。如果你覺得它對,那它就值得嘗試。
主持人:就像你必須做你真正熱愛的事情,否則你永遠(yuǎn)也造不出 Snapchat。因為在第一天,所有人都會說這想法太爛了。太棒了 Sam。
AI讓程序員提效10倍,今年就能實現(xiàn)
主持人:我們前幾天剛和你們的 CPO Kevin 做了一期播客,他跟我說代碼自動化會在 2025 年實現(xiàn)。Anthropic 說是 2027 年,他說不,我們能更快,可能 2025 或 2026。那你怎么看?你覺得什么時候“寫代碼=寫英文”會變成現(xiàn)實?還是說根本不會?
奧特曼:我覺得更重要的問題是“自動化的程度”。如果你說完全 100% 自動化,能構(gòu)建一個復(fù)雜系統(tǒng)而完全不碰代碼——這是一種情況。但我更關(guān)注的是“程序員效率提升10倍”這種事情。我認(rèn)為今年或明年就可能發(fā)生。
主持人:就是說程序員效率提升10倍。其實現(xiàn)在已經(jīng)提升了好幾倍了吧?我身邊用上 AI 的人,效率已經(jīng)提升得很明顯了。
奧特曼:有些人說是提升了2倍、3倍,但我還沒聽到有多少人說達(dá)到了10倍這種程度。
主持人:但你覺得明年就可能達(dá)到這種“質(zhì)變”?
奧特曼:預(yù)測,特別是帶有時間表的預(yù)測,總是很難。但我覺得我們可以把目標(biāo)定在那里。
主持人:你知道這里面其實也有些負(fù)面因素。比如 Daniel Gross 曾經(jīng)寫過一篇文章,說印度有 2500 億美元的出口是 IT 服務(wù)。站在這個角度想,有一天這些服務(wù)可能會被 GPT-4 或 GPT-5 的 token 替代。對印度來說,那 2500 億非常重要。而這些工程師中,不是所有人都能成為高端工程師,從而從這項技術(shù)中受益。有些人只是做簡單的 CRUD 應(yīng)用,但他們面臨來自“使用 AI 的10倍程序員”的競爭。而且那些工程師的成本可能更低,因為 token 本身就便宜。你覺得印度該怎么做,才能在這個過程中保持相關(guān)性?
奧特曼:我覺得這是一個非常重要的問題。從整體來說,我相信世界對代碼的需求遠(yuǎn)遠(yuǎn)超過了我們現(xiàn)在的供給。我的看法是,世界非常渴望更多的軟件,而現(xiàn)在正好到了爆發(fā)的時候。如果你給人們這些能大幅提高效率的工具,那些原本只能產(chǎn)出一定價值的開發(fā)者,將能創(chuàng)作出更高價值的產(chǎn)品。當(dāng)然,他們要為 AI 支付一部分費用,所以不能獨占全部價值,而且代碼的市場價格可能也會下降。但我愿意打賭,這就是“杰文斯悖論”的又一個例子。
主持人:所以說,雖然單價會降,但需求也會同步提升,是吧?
奧特曼:我認(rèn)為是這樣的。
主持人:聽你這么說還挺讓人安心的。
奧特曼:當(dāng)然,不是所有行業(yè)都會這樣。但代碼這一塊,我確實是這么判斷的。
談Agent:消費級用例即將成為Agent射程
主持人:我們現(xiàn)在也能看到一些早期的智能體(Agent)了。比如 DeepResearch,真的挺棒的,但它還是偏被動,不會自動讀取我的卡片并執(zhí)行操作。像 DeepResearch 風(fēng)險較低,但我們也看到你對 Agent 非常看好,很多公司也是。那么你覺得,到今年年底或明年,我們會看到哪些 Agent 的實際用例?哪些會出現(xiàn)在日常生活中?
奧特曼:還是用編程的例子來講吧。你對一個編碼Agent說:“我想加個新功能”,然后它自己去處理,過一會兒回來給你個 PR(Pull Request),說“搞定了”。這種事情一旦成為現(xiàn)實,會讓人覺得非常瘋狂。還有其他類別,比如讓 Agent 去替你完成某些事,像是網(wǎng)絡(luò)運營方向就已經(jīng)稍微展示了這種能力。我覺得代碼領(lǐng)域?qū)蔀橐粋€重要突破口。
主持人:那有沒有一些消費級的用例?比如點外賣、叫車這種。
奧特曼:這些正是我認(rèn)為一定會發(fā)生的事。而且,它們看起來會非常像“Agent風(fēng)格”的任務(wù)。
AI時代的職業(yè)發(fā)展:接觸新技術(shù),為自己的職業(yè)生涯負(fù)責(zé)
主持人:那我再問你一個問題。假設(shè)你現(xiàn)在是一個普通員工,但你所在的公司是個傳統(tǒng)企業(yè),適應(yīng)新技術(shù)很慢。他們可能試過 GPT-3,結(jié)果就覺得不過如此,后來就沒再管了。如果你在這樣的公司里,怎么勸都勸不動他們用新工具,你會怎么做?你會跳槽去一家動作更快但風(fēng)險更高的公司嗎?
奧特曼:我大概會這么做。因為我覺得不采用這些新技術(shù)的公司,以后會處境艱難。當(dāng)然,有些行業(yè)可能還能撐下去。但就我個人來說,我會為自己的職業(yè)負(fù)責(zé),我希望不斷學(xué)習(xí)成長。如果我感覺自己無法接觸到這些工具,那這家公司就很“壞掉”了。
主持人:有道理。那最后一個問題你就可以解放啦:你這么多年做了很多事,從 YC 到 OpenAI,也投資了不少公司。你對 AI 有什么觀點是最開始相信的,但后來你的看法完全改變了?
奧特曼:我原本以為 AI 會對社會產(chǎn)生更劇烈的沖擊。我曾經(jīng)有一個非常科幻的預(yù)想,覺得 AI 會徹底顛覆一切。也許未來確實會走向那一步,但目前,它只是一個超強的工具,生活的其他部分依舊照常運轉(zhuǎn)。其實我很高興這樣。我覺得這是好事,說明我當(dāng)年想得太天真了。事實證明如果真發(fā)生那種巨變,也許反而是壞事。但無論如何,現(xiàn)在的現(xiàn)實和我十年前的預(yù)期大不一樣,而我覺得這樣反而很好。
主持人:我也覺得這樣挺好。如果我們真的能擁有“神一樣的技術(shù)”,能解決醫(yī)療問題,減少我們討厭的工作,反而讓我們多做喜歡的事,那一定是件好事。我也希望這項技術(shù)最終能造福所有人。
談印度擁抱AI:目前是OpenAI增長最快市場
主持人:那印度有沒有貢獻(xiàn)力量?至少從你發(fā)的內(nèi)容來看,印度用戶非常活躍。
奧特曼:我相信印度現(xiàn)在是我們增長最快的市場。印度對我們來說一直都非常特別,它是最早在美國之外大規(guī)模接受AI的市場之一。現(xiàn)在,我?guī)缀蹩梢钥隙ǎ俏覀冊鲩L速度最快的市場。
主持人:哇,那真是……
奧特曼:看到這一切真的很酷。
主持人:這太瘋狂了。那你看到印度用戶在用AI做其他事情嗎?比如深度研究?他們是愿意付費的市場嗎?
奧特曼:幾個月前我去了印度,那時圖像生成工具還沒發(fā)布。我?guī)缀醪煌5芈牭礁鞣N用戶故事,他們講自己怎么用ChatGPT,用GPT-4做了什么。AI已經(jīng)深深滲透進(jìn)了印度社會,用途非常廣泛。當(dāng)然,也有用戶反饋我們的定價對印度市場的大規(guī)模普及來說太高了。我們也在研究解決辦法。可惜現(xiàn)在我們的算力成本仍然很高,但我們正在努力開發(fā)更高效的模型,我很樂觀,未來我們能把成本降下來。
謝謝你,Sam,這次采訪非常精彩。謝謝你臨時抽時間做這個節(jié)目。希望印度能繼續(xù)熱情使用這些技術(shù)。
奧特曼:我毫不懷疑這點。我從來沒見過一個國家對技術(shù)的采納速度這么快。
主持人:太酷了。希望我們能繼續(xù)做更多,也希望你能看到時間線上出現(xiàn)越來越多你們創(chuàng)造的作品。
本文轉(zhuǎn)載自??51CTO技術(shù)棧??,作者:伊風(fēng)
