GPT-4o再秀神操作,“復現”OpenAI總裁講課,網友當真了 精華
OpenAI總裁兼聯合創始人Greg再次大秀GPT-4o操作,結果網友直接緬懷DALL-E
。
直接看效果。
文本拼寫達到驚人的一致!手部細節、光照全都有,甚至后背上的Logo也完全正確。
有網友表示:恍惚間還以為真的是本人在講課。
也有人感嘆圖像生成技術發展的飛躍:Holy Cow!
從完全破碎的文本到風格一致、拼寫正確的寫作,只用了一次迭代。
GPT-4o讓網友直接緬懷DALL-E
GPT-4o發布以來,簡直就被玩兒瘋了,尤其是圖像生成這塊。
比如有網友發現,GPT-4o在組合任意圖像上面就像是打通了任督二脈。
給它兩張完全不相干的圖。
結果搖身一變,“悲傷蛙版的麥片”,這不廣告設計公司直接可以用了。
不過像生成統計圖,就有點子翻車…比如這個,將正態分布的前 10%染成紅色,就沒有完成。
還有更翻車的效果……
于是乎,就有人認為這應該是DALL-E,GPT-4o現在還沒辦法生成圖像。
如今Greg親自下場展現GPT-4o的圖像生成效果,應該也算是一種回應。
當然在評論區有網友質疑:這確定是同一個版本嗎?能不能給完整的提示?
但不管怎么說,OpenAI這次免費大開放,讓更多的人探索到GPT-4o的能力。
比如在上下文能力上面,有網友發現它就比GPT-4-Turbo好太多。
而在從情景對話這個場景中,GPT-4o也比ChatGPT更樂意談論自己的感受和意識。
Omni團隊大揭秘
Omni團隊負責人Prafulla Dhariwal也在社交網絡上表達了自己團隊成員的感謝,并坦言這項工作是從一年前開始的。
Prafulla Dhariwal本科畢業于MIT,隨后就前往OpenAI已經待了7個年頭。
他首先表示GPT-4o是他們團隊推出的第一個模型,也是OpenAI首個原生多模態大模型。
隨后就來了一個團隊大點名。
James Betker,負責圖像和音頻生成、數據準備、集成以及后續訓練。
Jamie Kiros:負責GPT-4o的視覺感知。
Rowan Zellers:讓模型/產品能夠像人類一樣自然地觀看視頻。
Alexis Conneau:首個在OpenAI提出Her愿景的人。他在個人簡介中提到是音頻AGI主管。
Gabriel Goh、Ishaan Gulrajani:負責Scaling Law相關的工作。
Alex Nichol、Heewoo Jun、Li JING,保障GPT-4o的圖像生成、3D生成的能力。
……
隨后奧特曼也隨手一個轉發評價,并表示這項工作引發了一場革命,它能改變我們使用計算機的方式。
本文轉自 量子位 ,作者:量子位
