奧特曼采訪回應(yīng)“偷走”吉卜力！GPT4o大爆炸；套殼OpenAI也能成為大生意；今年AI可以幫編程提效10倍！原創(chuàng)

發(fā)布于 2025-4-8 15:39

瀏覽

0收藏

整理 | 伊風(fēng)

出品 | 51CTO技術(shù)棧（微信號：blog51cto）

剛剛，奧特曼又有了一個新采訪！干貨滿滿。

在這場訪談中，OpenAI CEO 奧特曼接受了印度博主兼開發(fā)者 Varun Mayya 的專訪，聊到了多個當(dāng)前 AI 技術(shù)從業(yè)者最關(guān)心的話題：包括最近火爆出圈的 GPT-4o 圖像生成能力、Prompt Engineer 是否真的值得存在、Agent 的落地路徑等等，甚至還有他本人對 AI 帶來失業(yè)焦慮的思考。

畫個重點，本次采訪亮點有：

GPT-4o爆火，“現(xiàn)在生成的圖像數(shù)量遠(yuǎn)遠(yuǎn)超過了我原本以為互聯(lián)網(wǎng)有的需求。我們很快就會突破十億張總圖像的里程碑。”
談到“一鍵生成吉卜力”、宮崎駿"反對AI”的爭議話題，奧特曼表示AI會帶來內(nèi)容創(chuàng)作的民主化。“當(dāng)然，它也帶來一些負(fù)面影響，也確實改變了藝術(shù)形式本身。但從整體來看，這是進(jìn)步。”
“套殼”也會產(chǎn)生了不起的生意，OpenAI也是從這種貶低中成長起來的“他們說你們不過是個小研究實驗室，遲早會被 Google 碾壓。你們只是把點子包裝一下，真正的價值會被視頻平臺拿走、被大公司搶走。”
對于編程自動化問題，重要的是“提效”而非AI完全接管編程工作：“你說完全 100% 自動化，能構(gòu)建一個復(fù)雜系統(tǒng)而完全不碰代碼——這是一種情況。但我更關(guān)注的是“程序員效率提升10倍”這種事情。我認(rèn)為今年或明年就可能發(fā)生。”
不過，編程仍然是OpenAI的Agent瞄準(zhǔn)的方向。奧特曼表示，“代碼領(lǐng)域?qū)蔀橐粋€重要突破口。”

以下是經(jīng)過整理的播客訪談全文，為了方便閱讀，順序略微調(diào)整：

GPT-4o大爆：我們即將突破十億張總圖像生成里程碑

主持人：女士們先生們，我現(xiàn)在與 Sam Altman 在一起。Sam，最近我看到你發(fā)了不少推文。他們以前叫“posts”，現(xiàn)在又改叫“Xs”。我都不知道現(xiàn)在該叫什么了。

奧特曼：我也不知道他們現(xiàn)在叫啥。

主持人：反正你最近發(fā)了不少關(guān)于印度的內(nèi)容，也發(fā)了很多關(guān)于新版圖像生成的內(nèi)容。首先我得說，我有幸提前試用了那個圖像生成工具，真的非常棒。從情緒板制作、生成圖片、到UI設(shè)計，體驗都非常出色。而且這個工具還很智能。

我們做了個特別聰明的用例——我們讓它生成一個3D模型的正面圖，然后再讓它生成左側(cè)視角、右側(cè)視角和背面視角，再把這些圖像扔進(jìn)另一個模型中生成網(wǎng)格，并把這些貼圖重新映射上去。我們甚至還能讓它生成高度圖。想想幾個月前這些還不存在，現(xiàn)在居然做到了，真的太震撼了。現(xiàn)在的用戶反響如何？有沒有什么數(shù)據(jù)可以分享？

奧特曼：我不確定能不能分享具體數(shù)字，但我可以說，我們現(xiàn)在生成的圖像數(shù)量遠(yuǎn)遠(yuǎn)超過了我原本以為互聯(lián)網(wǎng)有的需求。我們很快就會突破十億張總圖像的里程碑。

主持人：哇哦，那可是個巨大的數(shù)字。你有沒有看到什么特別有創(chuàng)意的用法？除了把自己變成動漫風(fēng)之外。

奧特曼：讓我覺得特別興奮的是各種各樣的創(chuàng)意用例。當(dāng)然，最開始火起來的是把自己變成動漫角色，但后來我看到人們創(chuàng)造了很多我以前完全沒想過的新類型圖像，真的很驚喜。當(dāng)然，也有很多很棒的商業(yè)用途，比如小企業(yè)用它來做新Logo、平面設(shè)計等等。但最打動我的是那種純粹的創(chuàng)造力——人們用它做出了前所未有的圖像，這真的讓我很激動。

GPT-4o會讓設(shè)計類工作走向消亡嗎？——還未可知，但會有新工作

主持人：太棒了。我還想聊聊另一個方面，就是UI和設(shè)計類工作。我們原本以為這些工具一發(fā)布，就能代替我們完成大部分工作。但實際上，在我們公司，我們還有很多視頻剪輯師和平面設(shè)計師。結(jié)果發(fā)現(xiàn)我們還是需要人來操作這些工具——因為人類仍然需要負(fù)責(zé)任，需要維持上下文，某種程度上相當(dāng)于這些工具的“經(jīng)理”。你覺得這就是工作的演變路徑嗎？你有沒有觀察到類似現(xiàn)象？或者說你對未來工作的變化有怎樣的看法？

奧特曼：我覺得這會因職業(yè)而異，有些工作可能會完全消失，由AI端到端完成。但大多數(shù)情況是，人們有了新工具后，工作效率更高、質(zhì)量更好。比如，依然會有人負(fù)責(zé)讓網(wǎng)站看起來很棒，只不過大家對網(wǎng)站“好看”的期待會提升，結(jié)果是我們所有人都能看到更好的成果。也許內(nèi)容產(chǎn)出還會變多，在這樣的世界中，對這類工作的需求可能會更高。然后還會出現(xiàn)一些全新的職業(yè)，這是我們現(xiàn)在還沒見過的。

主持人：你現(xiàn)在有沒有一些例子？

奧特曼：比如一些客戶支持類的工作，我認(rèn)為AI已經(jīng)能端到端完成了，那屬于我剛才提到的第一類。至于第二類——我們剛剛在說的平面設(shè)計師的例子——審美仍然非常重要。

你知道的，平面設(shè)計師以前用紙筆做設(shè)計，后來有了電腦工具，他們能做得更多、更好。我們?nèi)匀恍枰獌?yōu)秀的平面設(shè)計。現(xiàn)在我們又有了新工具，它顯然會改變設(shè)計師的工作流程，一些原本有人付錢的任務(wù)，現(xiàn)在可能不會再有人付錢。

在我看來，未來依然會有“讓這個網(wǎng)站好看”的崗位，也許從業(yè)人數(shù)減少了，但他們收入更高；又或者從業(yè)人數(shù)變多了，因為我們突然能做出更多網(wǎng)站了。也許這個世界原本對平面設(shè)計的需求就遠(yuǎn)比我們承受得起的高——這方面我們現(xiàn)在還不好說。

還有一種是全新的工作類型，第一個例子就是“Prompt Engineer（提示工程師）”。在AI出現(xiàn)之前，根本不存在這個職位。甚至很難想象有這么一種職業(yè)。現(xiàn)在有很多這樣的例子，但這個對我來說最親切。

主持人：確實很有意思，每當(dāng)這些新職業(yè)出現(xiàn)時，總是先被人嘲笑。比如那些做“套殼”（rapper）的人，我們后面會聊到。就算是“提示工程師”，很多人現(xiàn)在也不當(dāng)回事。大家覺得只是寫寫英文而已。你會為這個職業(yè)辯護(hù)嗎？有沒有什么方法能讓這些剛進(jìn)入這個領(lǐng)域的人不覺得自己在“掉價”？

奧特曼：我小時候就知道我想學(xué)計算機編程，可是我身邊的大人都說，那就是個愛好，不是正經(jīng)職業(yè)。那時候他們覺得電腦沒前途，非得去當(dāng)醫(yī)生、律師這種“穩(wěn)定職業(yè)”才算正經(jīng)。他們覺得學(xué)編程是條危險的路。但我當(dāng)時覺得我理解了一些他們不懂的事。我真心鼓勵大家相信自己的判斷——就算某個工作在過去不是高地位、被認(rèn)可的，也不代表它將來不會變得有價值。這就是科技進(jìn)步的方式。

主持人：你以前寫過一篇博文，叫《被誤解的勇氣》（The Strength to Be Misunderstood），我超喜歡那篇。那篇文章真幫了我很多。你是很多年前寫的，我當(dāng)時剛決定做內(nèi)容創(chuàng)作者，那時候這個職業(yè)地位也不高。

奧特曼：說到你的工作，我記得大概十年前吧，我會去和年輕人聊創(chuàng)業(yè)。我喜歡問他們覺得哪些行業(yè)最有意思，因為年輕人的觀點往往不一樣，而且往往是對的。當(dāng)時很多人說他們想做YouTuber。我當(dāng)時一臉懵逼，心想：啥？但那一刻我意識到：我不能像別人以前否定程序員那樣，去否定他們。

正面回應(yīng)宮崎駿反對AI創(chuàng)作事件：內(nèi)容創(chuàng)作的門檻降低是好事

主持人：我還想提另一個最近在網(wǎng)上爭議比較大的話題：宮崎駿的那個視頻。那個視頻當(dāng)然是被斷章取義了——他在看一個很早期的模型動畫，一個怪物在扭動，他說“我不喜歡這個”。作為一個從業(yè)幾十年的藝術(shù)家，我能理解他的感受。我們創(chuàng)作圖像或視頻的過程，曾經(jīng)需要付出大量努力，現(xiàn)在卻變得簡單多了，有時反而有點失落。

作為藝術(shù)家，這種變化多少有點讓人沮喪。但作為一個創(chuàng)業(yè)者，要養(yǎng)團(tuán)隊、發(fā)工資，我又覺得這項技術(shù)非常有價值，它幫我提升了效率，減輕了壓力。你怎么看藝術(shù)的變化？我們該如何看待它？

奧特曼：想象一下三十年前你想做你現(xiàn)在做的事情，那幾乎是不可能的。你需要一個攝像機、VHS錄像帶，還得想辦法剪輯，這些步驟都很復(fù)雜。就算完成了，還得自己去分發(fā)錄像帶，因為當(dāng)時還沒有YouTube，網(wǎng)絡(luò)也很差。但現(xiàn)在，世界上任何人只要有一部智能手機，就能拍攝并上傳視頻。如果他說的內(nèi)容有趣，全世界都能看到并受益。

我認(rèn)為內(nèi)容創(chuàng)作的民主化對社會是個巨大好處。當(dāng)然，它也帶來一些負(fù)面影響，也確實改變了藝術(shù)形式本身。但從整體來看，這是進(jìn)步。我非常相信科技的力量，它可以賦予所有人更多工具，降低門檻，讓更多人有能力為社會做貢獻(xiàn)，最終大家都能從中獲益。是的，它可能會導(dǎo)致一些工作消失，也讓原本憑技能吃飯的人面臨更多競爭。但總體來說，這是社會的福祉。

我自己的親身經(jīng)歷是看到創(chuàng)業(yè)門檻的變化。以前創(chuàng)業(yè)需要很多資金和資源，但后來這些門檻都被削弱了，特別是像 AWS 的出現(xiàn)，這是其中最重要的轉(zhuǎn)折點之一。

另一個大變化就是互聯(lián)網(wǎng)的普及。再加上 Y Combinator 從 2005 年起所推動的一種潮流——年輕、有技術(shù)背景的創(chuàng)始人突然可以更容易地創(chuàng)辦公司了。這帶來了大量的新產(chǎn)品和新技術(shù)，造福了整個世界。當(dāng)然，被這些公司競爭掉的傳統(tǒng)企業(yè)可能不太高興。但從世界公民的角度來說，我們確實擁有了更多可能性。OpenAI 本身也是一個例子——我們這個小團(tuán)隊能做出這樣的事，只是因為技術(shù)棧的準(zhǔn)入門檻大大降低了。

我同意，特別是像 Stripe 出現(xiàn)之后，還有在印度，UPI 的普及，讓新的公司、新的產(chǎn)品激增。以前很多事因為繁瑣的流程根本做不起來。我猜設(shè)計領(lǐng)域現(xiàn)在也開始出現(xiàn)類似的變化。

套殼OpenAI也能獲得成功，重要的是走自己的創(chuàng)業(yè)路

主持人：說到 Y Combinator，我想請你戴上“20歲版本的你”的帽子——假設(shè)你回到當(dāng)年，知道現(xiàn)在所有的一切，有人勸你別去做“GPT套殼”（rapper），因為 OpenAI 遲早會干掉你；也有人說基礎(chǔ)模型沒用，套殼才是能賺錢、能融資的東西。在這樣的辯論下，你會怎么做？

奧特曼：你只是在做套殼”這種說法，其實以前在別的領(lǐng)域也常見。有人也說過，“你只是建立在 AWS 上的一個套殼”，類似的評論也不少。

但現(xiàn)在，人們基于 AI 正在建立非常了不起的新公司。大多數(shù)公司會失敗，或者發(fā)展一般，但有些會找到持久的商業(yè)模式，創(chuàng)造巨大的價值。這一直都是世界的運行方式——大多數(shù)初創(chuàng)公司都會失敗，但少數(shù)成功的會極其成功。所以，把所有東西都簡單 dismiss 掉，說它們只是套殼，聽起來好像很聰明，但實際上完全錯了。我記得人們以前對 OpenAI 也有類似的說法。

主持人：他們當(dāng)時都說了啥？

奧特曼：他們說你們不過是個小研究實驗室，遲早會被 Google 碾壓。你們只是把點子包裝一下，真正的價值會被視頻平臺拿走、被大公司搶走。這些話還是一兩年前說的。我覺得，有些話聽起來酷又老練，像是能看透一切。但要建立偉大的公司或投資它們，最關(guān)鍵的一課是：不要被這種“偽聰明”的觀點帶偏。所以如果我是現(xiàn)在在 YC 的 20 歲年輕人，有人說我做的是 GPT 套殼，我反而會覺得：嘿，我可能走在了正確的方向上。

主持人：那你有沒有具體的想法？如果你不是在 OpenAI，而是一個普通創(chuàng)業(yè)者，手上有 50 萬美元，你會做什么？

奧特曼：出于原則，我一般不回答這種問題。因為我最在意的是：大家不要去復(fù)制別人的創(chuàng)業(yè)點子。

我自己想出來的創(chuàng)業(yè)點子，說不定都挺“平庸”的。而某個現(xiàn)在正在寫代碼的 20 歲年輕人，提出一個聽起來荒謬又“爛透了”的想法，說不定那才是下一個 OpenAI。我不希望我拋出一個“中規(guī)中矩、與現(xiàn)實脫節(jié)”的想法，讓別人因此放棄自己瘋狂又獨特的創(chuàng)意。所以我的建議是：去做你那個瘋狂的點子。如果你覺得它對，那它就值得嘗試。

主持人：就像你必須做你真正熱愛的事情，否則你永遠(yuǎn)也造不出 Snapchat。因為在第一天，所有人都會說這想法太爛了。太棒了 Sam。

AI讓程序員提效10倍，今年就能實現(xiàn)

主持人：我們前幾天剛和你們的 CPO Kevin 做了一期播客，他跟我說代碼自動化會在 2025 年實現(xiàn)。Anthropic 說是 2027 年，他說不，我們能更快，可能 2025 或 2026。那你怎么看？你覺得什么時候“寫代碼=寫英文”會變成現(xiàn)實？還是說根本不會？

奧特曼：我覺得更重要的問題是“自動化的程度”。如果你說完全 100% 自動化，能構(gòu)建一個復(fù)雜系統(tǒng)而完全不碰代碼——這是一種情況。但我更關(guān)注的是“程序員效率提升10倍”這種事情。我認(rèn)為今年或明年就可能發(fā)生。

主持人：就是說程序員效率提升10倍。其實現(xiàn)在已經(jīng)提升了好幾倍了吧？我身邊用上 AI 的人，效率已經(jīng)提升得很明顯了。

奧特曼：有些人說是提升了2倍、3倍，但我還沒聽到有多少人說達(dá)到了10倍這種程度。

主持人：但你覺得明年就可能達(dá)到這種“質(zhì)變”？

奧特曼：預(yù)測，特別是帶有時間表的預(yù)測，總是很難。但我覺得我們可以把目標(biāo)定在那里。

主持人：你知道這里面其實也有些負(fù)面因素。比如 Daniel Gross 曾經(jīng)寫過一篇文章，說印度有 2500 億美元的出口是 IT 服務(wù)。站在這個角度想，有一天這些服務(wù)可能會被 GPT-4 或 GPT-5 的 token 替代。對印度來說，那 2500 億非常重要。而這些工程師中，不是所有人都能成為高端工程師，從而從這項技術(shù)中受益。有些人只是做簡單的 CRUD 應(yīng)用，但他們面臨來自“使用 AI 的10倍程序員”的競爭。而且那些工程師的成本可能更低，因為 token 本身就便宜。你覺得印度該怎么做，才能在這個過程中保持相關(guān)性？

奧特曼：我覺得這是一個非常重要的問題。從整體來說，我相信世界對代碼的需求遠(yuǎn)遠(yuǎn)超過了我們現(xiàn)在的供給。我的看法是，世界非常渴望更多的軟件，而現(xiàn)在正好到了爆發(fā)的時候。如果你給人們這些能大幅提高效率的工具，那些原本只能產(chǎn)出一定價值的開發(fā)者，將能創(chuàng)作出更高價值的產(chǎn)品。當(dāng)然，他們要為 AI 支付一部分費用，所以不能獨占全部價值，而且代碼的市場價格可能也會下降。但我愿意打賭，這就是“杰文斯悖論”的又一個例子。

主持人：所以說，雖然單價會降，但需求也會同步提升，是吧？

奧特曼：我認(rèn)為是這樣的。

主持人：聽你這么說還挺讓人安心的。

奧特曼：當(dāng)然，不是所有行業(yè)都會這樣。但代碼這一塊，我確實是這么判斷的。

談Agent：消費級用例即將成為Agent射程

主持人：我們現(xiàn)在也能看到一些早期的智能體（Agent）了。比如 DeepResearch，真的挺棒的，但它還是偏被動，不會自動讀取我的卡片并執(zhí)行操作。像 DeepResearch 風(fēng)險較低，但我們也看到你對 Agent 非常看好，很多公司也是。那么你覺得，到今年年底或明年，我們會看到哪些 Agent 的實際用例？哪些會出現(xiàn)在日常生活中？

奧特曼：還是用編程的例子來講吧。你對一個編碼Agent說：“我想加個新功能”，然后它自己去處理，過一會兒回來給你個 PR（Pull Request），說“搞定了”。這種事情一旦成為現(xiàn)實，會讓人覺得非常瘋狂。還有其他類別，比如讓 Agent 去替你完成某些事，像是網(wǎng)絡(luò)運營方向就已經(jīng)稍微展示了這種能力。我覺得代碼領(lǐng)域?qū)蔀橐粋€重要突破口。

主持人：那有沒有一些消費級的用例？比如點外賣、叫車這種。

奧特曼：這些正是我認(rèn)為一定會發(fā)生的事。而且，它們看起來會非常像“Agent風(fēng)格”的任務(wù)。

AI時代的職業(yè)發(fā)展：接觸新技術(shù)，為自己的職業(yè)生涯負(fù)責(zé)

主持人：那我再問你一個問題。假設(shè)你現(xiàn)在是一個普通員工，但你所在的公司是個傳統(tǒng)企業(yè)，適應(yīng)新技術(shù)很慢。他們可能試過 GPT-3，結(jié)果就覺得不過如此，后來就沒再管了。如果你在這樣的公司里，怎么勸都勸不動他們用新工具，你會怎么做？你會跳槽去一家動作更快但風(fēng)險更高的公司嗎？

奧特曼：我大概會這么做。因為我覺得不采用這些新技術(shù)的公司，以后會處境艱難。當(dāng)然，有些行業(yè)可能還能撐下去。但就我個人來說，我會為自己的職業(yè)負(fù)責(zé)，我希望不斷學(xué)習(xí)成長。如果我感覺自己無法接觸到這些工具，那這家公司就很“壞掉”了。

主持人：有道理。那最后一個問題你就可以解放啦：你這么多年做了很多事，從 YC 到 OpenAI，也投資了不少公司。你對 AI 有什么觀點是最開始相信的，但后來你的看法完全改變了？

奧特曼：我原本以為 AI 會對社會產(chǎn)生更劇烈的沖擊。我曾經(jīng)有一個非常科幻的預(yù)想，覺得 AI 會徹底顛覆一切。也許未來確實會走向那一步，但目前，它只是一個超強的工具，生活的其他部分依舊照常運轉(zhuǎn)。其實我很高興這樣。我覺得這是好事，說明我當(dāng)年想得太天真了。事實證明如果真發(fā)生那種巨變，也許反而是壞事。但無論如何，現(xiàn)在的現(xiàn)實和我十年前的預(yù)期大不一樣，而我覺得這樣反而很好。

主持人：我也覺得這樣挺好。如果我們真的能擁有“神一樣的技術(shù)”，能解決醫(yī)療問題，減少我們討厭的工作，反而讓我們多做喜歡的事，那一定是件好事。我也希望這項技術(shù)最終能造福所有人。

談印度擁抱AI：目前是OpenAI增長最快市場

主持人：那印度有沒有貢獻(xiàn)力量？至少從你發(fā)的內(nèi)容來看，印度用戶非常活躍。

奧特曼：我相信印度現(xiàn)在是我們增長最快的市場。印度對我們來說一直都非常特別，它是最早在美國之外大規(guī)模接受AI的市場之一。現(xiàn)在，我?guī)缀蹩梢钥隙ǎ俏覀冊鲩L速度最快的市場。

主持人：哇，那真是……

奧特曼：看到這一切真的很酷。

主持人：這太瘋狂了。那你看到印度用戶在用AI做其他事情嗎？比如深度研究？他們是愿意付費的市場嗎？

奧特曼：幾個月前我去了印度，那時圖像生成工具還沒發(fā)布。我?guī)缀醪煌５芈牭礁鞣N用戶故事，他們講自己怎么用ChatGPT，用GPT-4做了什么。AI已經(jīng)深深滲透進(jìn)了印度社會，用途非常廣泛。當(dāng)然，也有用戶反饋我們的定價對印度市場的大規(guī)模普及來說太高了。我們也在研究解決辦法。可惜現(xiàn)在我們的算力成本仍然很高，但我們正在努力開發(fā)更高效的模型，我很樂觀，未來我們能把成本降下來。

謝謝你，Sam，這次采訪非常精彩。謝謝你臨時抽時間做這個節(jié)目。希望印度能繼續(xù)熱情使用這些技術(shù)。

奧特曼：我毫不懷疑這點。我從來沒見過一個國家對技術(shù)的采納速度這么快。

主持人：太酷了。希望我們能繼續(xù)做更多，也希望你能看到時間線上出現(xiàn)越來越多你們創(chuàng)造的作品。

本文轉(zhuǎn)載自??51CTO技術(shù)棧??，作者：伊風(fēng)

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責(zé)任

標(biāo)簽

奧特曼

GPT4o

OpenAI

已于2025-4-8 16:33:26修改

贊

回復(fù)