使用Stable Diffusion生成超逼真人臉的三條途徑
譯文譯者 | 布加迪
審校 | 重樓
有沒有想過別人是如何使用AI圖像生成如此超逼真的人臉,而你自己的嘗試最終卻充斥著缺陷和失真,看起來明顯很假?你試著調整了提示和設置,但質量還是無法與你看到其他人生成的圖像相媲美。你做錯了什么?
這篇博文將逐一介紹三項關鍵技術,開始使用Stable Diffusion生成超逼真的人臉。首先,我們將介紹提示工程的基礎知識,幫助你使用基本模型生成圖像。接下來,我們將探討如何升級到Stable Diffusion XL模型可以通過更大的參數和訓練顯著提高圖像質量。最后,我將介紹一個專門用于生成高質量圖像的自定義模型。
1. 提示工程
首先,我們將學習寫正面和負面的提示,以生成逼真的人臉。我們將使用在Hugging Face Spaces上提供的Stable Diffusion版本2.1演示版。它是免費的,你根本不用設置就可以開始入手。
鏈接:hf.co/spaces/stabilityai/stable-diffusion
創建正面提示時,確保包括圖像的所有必要的細節和風格。在這個例子中,我們想生成一個走在街上的年輕女子的圖像。我們將使用基本的負面提示,但你可以添加額外的關鍵字,以避免圖像中的任何重復性錯誤。
正面提示:“一個20多歲的年輕女子,走在街上,直視鏡頭,自信而友好的表情,穿著隨意,一身現代時尚的服裝,城市街景背景,陽光明媚的白天光線,鮮艷的色彩。”
負面提示:“外貌丑陋,難看,不成熟,卡通,動漫,3D,繪畫,卡通,插圖,最差質量,低質量”。
我們有一個良好的開端。圖像是準確的,但圖像的質量還有待提高。你可以調整提示,但這是你從基本模型得到的最好結果。
2. Stable Diffusion XL
我們將使用Stable Diffusion XL(SDXL)模型來生成高質量圖像。先使用基本模式生成latent圖像,然后使用提煉器對其進行處理,以生成詳細而準確的圖像。
鏈接:hf.co/spaces/hysts/SD-XL
在生成圖像之前,我們將向下滾動,并打開“高級選項”。我們將添加一個負面提示,設置種子,并運用提煉器以獲得最佳圖像質量。
然后,我們將編寫與之前相同的提示,只是做了一些小的更改。我們將生成一個年輕的印度女性的圖像,而不是一個普通的年輕女性的圖像。
這個結果經過了大幅改善。人臉五官完美。不妨嘗試生成其他種族的人臉,以檢查偏差并比較結果。
我們得到了逼真的臉,但所有圖像都有Instagram濾鏡。通常,皮膚在現實生活中并不光滑,會有粉刺、斑點、雀斑和皺紋。
3. CivitAI:RealVisXL V2.0
在這一部分中,我們將生成帶有疤痕和逼真皮膚的精致人臉。為此,我們將使用CivitAI的自定義模型(RealVisXL V2.0),該模型進行了微調,以獲得高質量圖像。
鏈接:civitai.com/models/139562/realvisxl-v20
你可以通過點擊“創建”按鈕在線使用該模型,也可以通過Stable Diffusion WebUI下載到本地使用。
首先,下載模型并將文件移動到Stable Diffusion WebUI模型目錄:C:\WebUI\webui\ models\Stable- Diffusion。
要在WebUI上顯示模型,你必須按刷新按鈕,然后選擇“realvisxl20…”模型檢查點。
我們將從編寫相同的正面提示和負面提示開始入手,生成高質量的1024X1024圖像。
這張照片看起來很完美。為了充分利用自定義模型,我們必須更改提示。
新的正面和負面提示可以通過向下滾動模型頁面并點擊你喜歡的逼真圖像來獲得。CivitAI上的圖像隨帶正面和負面提示以及先進的轉向。
正面提示:“一個印度年輕女子的形象,專注,果斷,逼真,動態姿勢,超高分辨率,銳利的紋理,高細節的RAW照片,精致的人臉,淺景深,銳利的眼睛,(逼真的皮膚紋理:1.2),淺色皮膚,DSLR,膠片紋理”
負面提示:“(最差質量,低質量,插圖,3D, 2D,繪畫,漫畫,素描),張嘴”
我們有一個印度女人的詳細圖像,皮膚逼真。與基本的SDXL模型相比,它是一個改進版。
我們又生成了三個圖像來比較不同的種族。結果驚人,包含皮膚疤痕、凹凸不平的皮膚和準確的臉部特征。
結論
生成式藝術方面的進步將很快達到真實圖像和合成圖像難以區分的水平。這標志著在將來,任何人都可以利用基于各種現實世界數據訓練的自定義模型,由簡單的文本提示創建高度逼真的可傳播媒介??焖俚倪M步意味著令人興奮的潛力——也許有一天,生成逼真的視頻可能像輸入描述性提示一樣簡單。
我們在這篇文章中學習了提示工程、先進的Stable設計模型和服裝微調模型,以生成高度準確和逼真的人臉。如果你想要更好的效果,建議在civitai.com上探究各種高質量的模型。
原文標題:3 Ways to Generate Hyper-Realistic Faces Using Stable Diffusion,作者:Abid Ali Awan