剛剛,OpenAI發布GPT-image-1模型,更強吉卜力版本來啦 精華
今天凌晨1點30,OpenAI發布了全新圖像模型GPT-image-1,已經通過API向全球開發者開放使用。
GPT-image-1與ChatGPT版本有很大不同,可以控制生成圖像的敏感度、生成效率、背景、輸出格式、渲染質量、壓縮質量等,并且支持全網爆火的吉卜力模式。目前,Adobe、Figma、HeyGen、Wix等知名企業已經將該模型集成在產品中。
需要注意的是,OpenAI已經對新模型的API使用了全新身份驗證。如果無法通過驗證的小伙伴,可以使用微軟的Azure云服務來體驗。
詳細API指南:??https://platform.openai.com/docs/guides/image-generation?image-generation-model=GPT-image-1??
GPT-image-1應用案例
目前,已經有眾多知名企業開始將GPT-image-1模型應用在實際業務中,例如,多媒體巨頭Adobe已經將其集成在Firefly 和 Express應用中,為用戶提供不同類型的圖片風格。
云設計平臺Figma通過GPT-image-1只用簡單的提示生成和編輯圖像,就能幫助設計師直接在 Figma 中快速獲取想法并進行視覺迭代。
AI視頻平臺HeyGen 正在使用 GPT-image-1 來增強頭像創建,特別是改進平臺內的頭像編輯。
云開發平臺Wix通過GPT-image-1可以幫助任何用戶將其想法快速變成現實。
圖像設計平臺Photoroom正在使用 GPT-image-1 幫助在線賣家通過一張產品照片即時創建工作室品質的視覺效果、生活場景和模特照片。
GPT-image-1支持哪些高級定制
開發者通過API最大特色就是支持各種高級功能的定制。例如,通常我們用GPT-4o來生成圖像一般是一張,但通過API只需要設置一個N參數,就可以一次生成多張。
用多張圖像作為提示詞,例如,我們直接用四張單圖,直接合成一張完成的禮品新圖像。
使用過Photoshop合成圖片的小伙伴應該都知道很重要的一個功能—蒙版。現在通過GPT-image-1也能輕松實現了。
提示詞:陽光明媚的室內休息區,有一個游泳池,池中有一只火烈鳥。然后進行蒙版涂抹。
最終輸出的圖像。
開發者也可以對圖片的透明度進行更改,只需要將background 參數設置為 transparent 即可。但僅支持png 和 webp 輸出格式。
此外,開發者也可以通過API設置GPT-image-1的圖像尺寸1024x1024、1024x1536、1024x1536或者自動;渲染質量,low、medium 、high三種;壓縮格式,JPEG 和WebP 格式的壓縮級別(0-100%)。
所以,通過GPT-image-1的API來生成圖片,自由度極高,徹底釋放用戶的想法,生成的圖像也非常好。
定價方面,文本輸入每100萬token為5美元,圖像輸入每100萬token為5 10 美元;圖像輸出每100萬token為40美元。
在實際使用中,低質量的1024x1024圖像生成成本大約為每張 0.02 美元,中等質量的圖像約為每張 0.07 美元,而高質量圖像則約為每張 0.19 美元。
OpenAI首席執行官兼聯合創始人Sam Altman也贊揚了該模型,并表示與ChatGPT版本有很大的不同。
網友表示,這次 API 發布對開發者來說意義重大。單是圖像編輯功能,就能開啟眾多此前無法實現的創意應用場景。
這個模型太棒了!會取代DALL-E系列嗎?
圖像生成功能的集成如今拓寬了 API 用戶的創意可能性。期待看到開發者們的應用不斷增加。這是引人注目的創新。
這很有意思!API 在底層提供了更多的控制能力。對于特定的應用場景而言,自定義審核敏感度以及平衡質量與速度可能會帶來變革。
