AI PS卷起來了!谷歌Gemini動嘴P圖火出圈,馬斯克Grok連夜上線圖像編輯
Grok連夜上線圖片編輯功能。
昨晚,Grok上線圖片編輯功能,可以通過文字描述直接修改圖片。
比如你可以上傳一張個人證件照,「動動嘴」讓Grok給你PS一套全新的西服。
看起來效果非常不錯,Grok還「體貼地」給你設計了四種不同風格,比如領帶「帶花紋」和「不帶花紋」。
不過該功能目前應該還是在灰度測試中(作為Premium氪金用戶的Grok主頁暫時還沒有編輯按鈕)。
Grok手機APP同步上線
Grok也同步上線了X的手機APP,你也可以在手機上體驗圖片編輯功能。
比如上傳一張照片,讓圖片中人物的「黑發」變成「金發」。
不過作為手機內部的Grok功能,目前同樣是在灰度測試中。
由于Grok灰色測試,目前全網還沒有太多討論。
不過從一些博主的測試作品來看,Grok應該是對自己的效果很有信心。
比如這位有6萬粉絲的Borriss博主,他的頭像是一件「黑色高領毛衣」。
但是經過Grok的P圖后,換成了一套「西服」。
「黑毛衣秒變西服」,AI編輯的能力目前看起來效果并不賴。
其他陸續有用戶放出了自己使用Grok編輯圖片的效果,不過這次Grok犯了一個錯誤,把用戶的臉也給換了。
比如,可以將圖片風格變成Egon Shiele的畫作風格。
或者是給馬斯克加一頂帽子。
大模型「內卷」,PS受傷
Grok這次「連夜」上傳圖片編輯功能,大概率是被Google的Gemini2.0火出圈的「動動嘴」PS功能給刺激到了。
Google發布Gemini-2.0-flash的Experimantal版本靠著簡單的文本描述就能「P圖」的能力著實火了一把。
比如將兩張照片P在一起還不違和,并且可以添加人物動作。
或者,將白色風格的裙子換成紅色,還能給人物打個領帶。
從Gemin2.0到Grok的圖片編輯,能看出目前SOTA模型的「內卷」依然還在進行。
大模型也在「搶占」用戶心智。
以后人們談起P圖,第一個想到也許不是Photoshop這種傳統的圖片編輯軟件,而是AI賦能各種大模型功能。
從P圖這件事情可以窺見一些苗頭,AI的發展很可能會帶來一個很大的「范式轉移」。
未來的很多工作會從「復雜操作」變成「簡單交互」。
比如在圖片編輯領域,Gemini和Grok等大模型將持續降低圖片編輯的技術門檻。
從原來需要專業軟件、復雜步驟,到只需一句自然語言指令即可實現高質量圖片編輯。
當然在目前的大模型P圖效果依然停留在「可玩」的層面,專業的圖片編輯還需要專業的UI工程師使用特定的軟件才能完成。
不過SOTA模型的內卷依然沒有結束。
正如Alvaro Cintas所說,為什么OpenAI還沒有發布原生圖像生成和編輯功能。
也許快了,說不定哪天ChatGPT就放出編輯原生圖片。