Midjourney能生成文字了!V6版5大升級驚艷網友
Midjourney重磅更新,V6版本問世!
更新后最大看點是圖像更真實、細節處理更細膩:
和上一代對比來看更直觀。
就說一道番茄燉牛腩,右邊的圖不僅菜看起來更自然、更有食欲,就連木勺的細節也沒放過(左V5.2,右V6):
再來看對人物的刻畫,V6光影等細節拉滿。相比之下,V5.2根本不是一個level(上V6,下V5.2):
風景圖的處理也是一眼就能區分哪個更真實自然(左V5.2,右V6):
另外,新版本還有一大看頭是可以對簡單的文字進行處理了,只需給要繪制的文字加上"引號",比如"Hello World!":
終于不是亂碼了!
創始人David Holz在Discord發帖公布了V6的問世,并且表示V6是團隊從頭開始訓練的第三個模型,開發過程已持續了9個月。
總結來說,V6共有5大升級:
- 更精確且更長的提示響應
- 改進了連貫性和模型知識
- 圖像生成和混合(remix)得到了優化
- 新增了基礎文字繪制功能
- upscale(放大器)功能得到增強,具有’subtle’和’creative’兩種模式,分辨率提升兩倍
此外,David Holz表示目前V6處于“alpha test”階段,會隨時變化,之后會升級到完整版。
這也就意味著,接下來幾周內,V6的速度、圖像質量、連貫性、提示響應和文本準確性會再次提高。
而目前V6相比于V5來說速度更慢、成本更高(大約每次imagine消耗1gpu/min,每次upscale消耗2gpu/min),但昨天已對V6做了一次更新,速度已提高2.7倍:
V6的問世,讓網友們又有新東西玩了,各種測試對比都非?;鸨?/p>
不過,要想玩好V6,再用之前的提示策略恐怕是不行了。
David Holz明確表示“V6的提示與V5有很大不同,你需要重新學習如何提示”。
效果:寫真真真
先來看一波網友們的測試效果。
讓Midjourney V5.2(左)、V6(右)畫一個酒吧,需要用燈牌標注”open late”(營業到很晚),V6畫起來毫無難度:
再來體驗一下更新后的Upscale,正常圖片是這樣嬸兒的:
Subtle(上)、Creative(下)兩種不同模式,家人們更中意哪張?
Creative連鏡子里的細節都給處理了。
這里還有和其它AI繪圖工具的比較,比如說DALL·E 3、Adobe Firefly。
Midjourney V6在不同風格的圖片生成上,都表現出眾:
是能夠以假亂真的那種了:
甚至,V6還通過的香煙測試。不僅煙真實,手的歲月感也刻畫得淋漓盡致:
但正如上面提到的,Midjourney V6更新不只是改變了效果,還有提示詞。
好在David Holz給到了一些提示小妙招,其中就包括:
- 避免使用無關緊要的詞,如award winning、photorealistic、4k、8k;
- 明確表達你想要的內容,表達明確,模型理解得更好;
- 如果你想要更具攝影感、更中立、更直接的效果,可以默認使用—style raw;
- 較低的—stylize值(默認100)可能會有更好的提示理解,而較高的值(最高1000)可能會有更好的美學效果。
我們也來簡單上手體驗一把。
開盒Midjourney V6
召喚V6的方法有三種,可以選擇在Midjourney Discord服務器中鍵入斜杠命令“/settings”,或者在給Midjourney bot的直接消息(DM)中鍵入,然后使用頂部的下拉菜單選擇V6,又或是在提示詞后手動輸入“—v 6.0”。
我們讓Midjourney描繪一幅跨年夜的場景,要求要有漫天飛舞的大雪,還要有一個牌子上面寫著“新年快樂”:
Please depict a New Year’s Eve scene with heavy snow falling all around, and include a sign with the words "Happy New Year" on it.
該說不說,雖然很有feel,但“字”的發揮還是不穩定。
完全相同的提示詞下,V5.2版本整體偏暖色調,但這么一看V6畫字還是很有水平的??:
緊接著,點擊任意一張圖Upscale:
就可以看到兩個新的模式Subtle、Creative:
下面是Creative的效果,家人們如何評價?