成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Midjourney危!Stable Diffusion-XL開啟公測:會畫手、能寫字,再也不用寫長prompt了

人工智能 新聞
開源、免費的Stable Diffusion就能達到Midjourney水平!

自從Midjourney發布v5之后,在生成圖像的人物真實程度、手指細節等方面都有了顯著改善,并且在prompt理解的準確性、審美多樣性和語言理解方面也都取得了進步。

相比之下,Stable Diffusion雖然免費、開源,但每次都要寫一大長串的prompt,想生成高質量的圖像全靠多次抽卡。

圖片

最近Stability AI的官宣,正在研發的Stable Diffusion XL開始面向公眾測試,目前可以在Clipdrop平臺免費試用。

圖片

試用鏈接:?https://clipdrop.co/stable-diffusion?

Stability AI的創始人兼首席執行官Emad Mostaque表示,目前該模型仍然處于訓練階段,等參數穩定后將會開源;SD-XL在「握手」等圖像細節方面會表現更好,幾乎完全可控。

圖片

Stable Diffusion XL也并不是最終發布版的名字,并且也并非是v3,因為SD-XL的架構和SD-v2系列的模型架構非常相似。

圖片

Minimalistic home gym with rubber flooring, wall-mounted TV, weight bench, medicine ball, dumbbells, yoga mats, high-tech equipment, high detail, organized and efficient.

簡約的家庭健身房,橡膠地板,壁掛式電視,舉重凳,藥球,啞鈴,瑜伽墊,高科技設備,高細節,組織和效率

下面幾張SD-XL官方發布的例圖,可以看出圖像的質量已經非常能打了。

圖片

圖片

圖片

不過有時候less并不代表more,有網友認為SD-XL為了擺脫「糟糕的品味」,設定了太多的規則,定制化空間越來越小,不符合大多數人的喜好。目前v1.5的Stable Diffusion仍然是社區內最流行的基座模型。

圖片

網友表示希望新版SD能夠和SD 2.1版本的嵌入、hypernetworkds和Lora模型保持兼容,再從零開始重訓的話就太難受了。

圖片

也有網友認為,SD-XL的表現和civit網站上網友分享的模型差不多,新模型的效果也并不是特別驚艷,也就是平均水平。

圖片

SD-XL:開源版Midjourney

關于Stable Diffusion XL模型的具體信息,官方并沒有透露太多,目前只知道是一個與v2模型架構相似、但規模和參數量更大的模型。

SD-v2.1包括9億參數,SD-XL大約有23億參數,Emad表示正式版可能會額外發布一個更小的蒸餾版本。

SD-XL相比之前版本的改進如下:

  • 使用較短的描述性prompt即可生成高質量圖像
  • 可以生成更貼合prompt的圖像
  • 圖像中的人體結構更合理
  • 與 v2.1和 v1.5版本(程度較輕)相比,SD-XL生成的圖片更符合大眾審美
  • 負面提示詞(negative prompt)是可選項
  • 生成的肖像圖更逼真
  • 圖像中的文本更清晰

需要注意的是,SD-XL可能與之前版本的插件不兼容。

清晰可讀的文字

在v1系列和v2.1版本的Stable Diffusion模型中,并不具備在圖片中生成可讀文本的能力。

雖然SD-XL生成的文本信息并不總是準確,但確實得到了巨大的提升。

圖片

Photo of a woman sitting in a restaurant holding a menu that says “Menu”

一個女人坐在餐館里拿著寫著「Menu」的菜單

圖片

Photo of a man holding a sign that says “Stable Diffusion”

一個男人舉著寫著「Stable Diffusion」的牌子

a young female holding a sign that says “Stable Diffusion”, highlights in hair, sitting outside restaurant, brown eyes, wearing a dress, side light

一個年輕的女性舉著一個牌子,上面寫著「Stable Diffusion」,頭發高亮,坐在餐廳外面,棕色的眼睛,穿著裙子,側燈

更好的人體結構

Stable Diffusion在生成人體解剖結構方面一直存在諸多問題,多幾條腿、少個胳膊實在是太常見不過的問題,通常需要使用inpaint功能進一步對圖像細節進行修正;或者是使用ControlNet的Open Pose功能從參考圖像中復制人體的姿態。

比如說SD-v1.5生成瑜伽的圖像,經常會出現扭曲的人體。

圖片

Photo of a woman in yoga outfit, triangle pose, beach in evening, rim lighting

一個女人的照片在瑜伽服裝,三角形的姿勢,海灘在晚上,邊緣照明

SD-XL雖然生成的圖像并不完美,不過在人體姿態方面已經有了顯著的進步。

圖片

更有美感(more aesthetic)

比如同樣以屋子為主題,SD-XL可以生成更對稱、視覺效果更好的照片。

圖片

SD-XL在肖像照片上也有顯著改進。

圖片

photo shot of a woman

一個女人的照片

更貼合prompt的圖像

SD-XL可以更好地理解輸入的prompt,并生成更精確的圖像。

比如以duotone(雙色)為例,SD-v1.5只會生成黑白圖像,而SD-XL則可以生成具有多種顏色的雙色調圖像。

與 v1模型相比,理解提示符的能力有所提高。

圖片

duotone portrait of a woman

一個女人的雙色調肖像

因為SD-XL同屬v2系列模型,所以文本模型尺寸更大,可以比v1模型更好地理解提示詞。

圖片

比如下面的例子中,v1.5模型始終無法理解圖像中的兩個主題(機器人和人類),但SD-XL模型可以生成正常的圖像(雖然機器人還是不夠big)。

圖片

big robot friend sitting next to a human, ghost in the shell style, anime wallpaper

大機器人朋友坐在人類旁邊攻殼機動隊風格的動漫壁紙

圖片

a young man, highlights in hair, brown eyes, in white shirt and blue jean on a beach with a volcano in background

一個年輕人,頭發染得很亮,棕色眼睛,穿著白襯衫和藍色牛仔褲,站在海灘上,背景是一座火山

藝術風格

在藝術風格上,SD-XL并沒有顯著改進,和之前的版本各有千秋。

比如兩個模型以不同的角度生成了Edward Hopper風格的圖像。

圖片

New York city by Edward Hopper

Edward Hopper繪制的紐約

Leonid Afmov 的風格中,SD-v1.5更準確,SD-XL缺少了不同顏色的筆刷(unmistakable colorful board brushstrokes)。

圖片

New York city by Leonid Afremov

Leonid Afemov繪制的紐約

William-Adolphe Bouguereau風格中,V1.5和SDXL都可以生成一些類似的內容,其中SD-XL更接近Bouguereau創作的經典學院派繪畫,并且面部細節更多。

圖片

Portrait of beautiful woman by William-Adolphe Bouguereau

William-Adolphe Bouguereau繪制的美女肖像

風格轉變問題

在添加一些無關緊要的關鍵字后,模型的風格可能會突然轉變。

比如先生成一張照片風格的圖像。

圖片

a young man, highlights in hair, brown eyes, in white shirt and blue jean on a beach with a volcano in background

一個年輕人,頭發染得很亮,棕色眼睛,穿著白襯衫和藍色牛仔褲,站在海灘上,背景是一座火山

再添加一條黃色的圍巾后,圖像風格就變成了卡通風格。

圖片

a young man, highlights in hair, brown eyes, wearing a yellow scarf, in white shirt and blue jean on a beach with a volcano in background

一個年輕人,頭發染得很亮,棕色的眼睛,圍著黃色的圍巾,穿著白襯衫和藍色牛仔褲,站在一個火山為背景的海灘上

問題的故障可能源于預覽問題,在正式發布后該問題不知能否得到解決。

責任編輯:張燕妮 來源: 新智元
相關推薦

2021-12-21 09:05:46

命令Linux敲錯

2023-05-26 15:53:48

MidjourneyAI圖像

2024-04-15 00:08:00

MySQLInnoDB數據庫

2015-05-29 09:01:48

2024-11-27 14:30:46

2020-06-15 08:03:17

大文件OOM內存

2023-07-29 22:02:06

MyBatis數據庫配置

2024-12-06 10:21:04

2020-04-30 10:45:14

IDEA代碼神器工具

2018-10-11 15:51:32

ChromeGoogle瀏覽器

2023-11-27 17:11:02

數據庫oracle

2022-06-01 10:09:39

Linux網絡延遲

2020-12-18 08:23:16

安卓手機系統谷歌

2024-01-26 07:00:11

Python工具無向圖

2021-08-13 22:38:36

大數據互聯網技術

2025-04-25 10:00:00

2019-09-04 10:00:07

手機人臉識別

2021-03-26 15:18:11

代碼工具Mockoon

2015-10-22 10:38:43

Wi-Fi燃氣報警器

2020-01-21 21:15:16

WiFi網絡WiFi6
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 在线看黄免费 | 精品视频999 | 一级黄色片一级黄色片 | 欧美一级在线免费观看 | 色综合天天天天做夜夜夜夜做 | 日韩在线免费视频 | 日本不卡一区二区三区 | 国产精品精品视频 | 日韩伦理一区二区 | 欧美精品一区二区在线观看 | 日日夜夜91 | 精品亚洲一区二区三区四区五区高 | 免费一区 | 美国av毛片| 午夜一区二区三区 | 精品伊人 | 国产亚洲精品精品国产亚洲综合 | 亚洲欧洲在线视频 | 精品一区二区久久久久久久网站 | 成人欧美日韩一区二区三区 | 请别相信他免费喜剧电影在线观看 | 亚洲精品欧美一区二区三区 | 欧美11一13sex性hd| 亚洲精品视频网站在线观看 | 黄色在线网站 | 亚洲va中文字幕 | 男女免费在线观看视频 | 中文字幕加勒比 | 久久久久久久国产精品 | 国产精品夜夜春夜夜爽久久电影 | 亚洲精品2 | 五月精品视频 | 羞羞视频在线观看免费观看 | 二区在线视频 | 免费在线观看一区二区 | 欧美精品一区在线发布 | 大香网伊人 | 久久久久久女 | 日韩电影中文字幕 | 国产精品久久久久久久7777 | 一区二区三区中文字幕 |