OpenAI 的新 GPT-4o 圖像生成技術絕對會改變游戲規則

作者：dev 2025-04-07 00:00:00

傳統的 Photoshop 頂多就是簡單地將人物圖層疊加到背景圖上，對光影和角度的細節通常還要手動調整。但 GPT-4o 呢？

GPT-4o 的圖像生成功能剛剛發布就直接開始摧毀傳統行業，甚至讓 OpenAI 的 CEO 山姆·奧特曼（Sam Altman）都直呼：“我也看不懂眼前發生的一切！”

圖片

傳統的設計軟件，比如 Photoshop，現在可真是如臨大敵了。

來看一個讓人震驚的圖像融合實例：

圖片

傳統的 Photoshop 頂多就是簡單地將人物圖層疊加到背景圖上，對光影和角度的細節通常還要手動調整。但 GPT-4o 呢？

它對圖像的理解已經達到前所未有的深度——看看下面的對比圖：

你注意到細節了嗎？人物和房間的3D角度與光線完全融合，GPT-4o 不再只是簡單地拼接或調用 DALL-E 后臺了，而是真正意義上的“理解”圖片本身！

再看看這張圖：

圖片

你覺得訓練數據里可能有這種獨特而精確的圖像嗎？顯然不可能！

過去有些人認為 AI 圖片生成不過是“復制”或“隨機拼貼”——而 GPT-4o 徹底打破了這種誤解。它對用戶 prompt 的理解精準得讓人難以置信。

圖片

舉個簡單例子：它現在甚至能完美繪制一杯真實感爆棚的紅酒。

圖片

三、文字的理解和生成能力質的飛躍

下面這個例子簡直讓人目瞪口呆：

圖片

圖像理解的驚艷：GPT-4o 能準確地在完全不同的繪畫風格之間轉換圖像，并保留面部表情。
上下文理解的突破：注意原漫畫中第四個女孩舉手指向服務員的動作，GPT-4o 在新風格里完美還原了這個動作，甚至比原圖更準確地表達了“點單”的情境！你甚至可以要求它精確還原原來的手勢，它也完全能夠做到。
文字生成的巨大進步：傳統 AI 圖片生成工具對文字生成一直都非常吃力，而 GPT-4o 輕松復刻了對話氣泡中的文本，甚至自動給最后一個女孩加了個感嘆號，更貼合她驚訝的表情與情景氛圍。

圖片

另外，現在 GPT-4o 也能輕松地將文字直接融合進圖像中，對于海報、社交媒體圖文設計等場景簡直完美：

如果你不認為這已經徹底顛覆了傳統的圖像編輯與平面設計工具（比如 Photoshop 和 Illustrator），那你可真得給我解釋一下，到底什么才叫“顛覆”。

圖片

難怪這些天你在社交媒體上總能刷到大量類似“吉卜力動畫風格”的精美圖片，這已經迅速成為一種新潮流：

圖片

目前 OpenAI 僅為付費用戶開放了 GPT-4o 圖像功能，免費用戶還需稍等一段時間，因為需要擴展技術規模，確保所有人都能獲得最佳體驗。

毫無疑問，GPT-4o 的圖像生成功能標志著人工智能生成圖像領域的巨大飛躍，極大地威脅了傳統設計工具的市場地位。

更讓人興奮的是，這只是個開始——AI 的下一波創新浪潮已經蓄勢待發，你準備好了嗎？

責任編輯：武曉燕來源：大遷世界