如何利用深度學習制作專業水準的照片?
機器學習 (ML) 在許多目標明確的領域都表現卓越。答案非對即錯的任務有助于訓練過程,也可使算法實現其預期目標,無論是正確識別圖像中的物體,還是將一種語言適當地翻譯成另一種語言。不過,有些領域并沒有客觀的評估標準。例如,一張照片是否美麗要按其美學價值進行衡量,而美學價值是一個非常主觀化的概念。
▲ 一張加拿大賈斯珀國家公園的專業照片
為了探究機器學習能否學習主觀性概念,我們引入了一個用于藝術內容創作的實驗性深度學習系統:
https://arxiv.org/abs/1707.03491
該系統可模仿一個專業攝影師的工作流程,瀏覽來自 Google 街景的全景照片,并搜索最佳構圖,然后進行各種后期處理操作以制作一張具有美感的圖像。我們的虛擬攝影師“瀏覽”了大約 4 萬張全景照片(拍攝地為阿爾卑斯山、加拿大班夫公園和賈斯珀國家公園、加利福尼亞州大蘇爾以及黃石公園等),并據此制作出令人印象深刻的照片,根據專業攝影師的評判,有些照片甚至接近專業水準。
訓練模型
盡管可使用 AVA 等數據集對美學進行建模,但單純用它來提升照片品質可能會使照片欠缺某些美感,如照片過度飽和。不過,利用監督式學習正確地學習美學的多個要素可能需要一個標注數據集,而該數據集很難收集。
我們的方法只依賴于專業品質的照片集,無需在之前/之后進行圖像比對,也無需任何額外的標簽。該方法自動將美學分解成多個要素,每個要素都通過一個耦合的圖像操作產生的反面示例進行單獨學習。通過使這些圖像操作保持“半正交”,我們可以通過快速并且可分離的優化來改善照片的構圖、飽和度/HDR 水平及戲劇性光線。
全景照片
上圖是一張全景照片 (a) 被剪裁成 (b),飽和度和 HDR 強度在 (c) 中得到提升,(d) 中則應用了戲劇性蒙版。每一步都根據所學習的一個美學要素完成。
傳統圖像濾鏡可用于生成飽和度、HDR 細節和構圖的反面訓練示例。我們也引入了一個名為戲劇性蒙版的特殊操作,它是在學習戲劇性光線的概念時創建的。反面示例是通過應用一組圖像濾鏡(隨機修改專業照片的亮度,降低照片質量)而生成的。我們使用生成式對抗網絡 (GAN) 進行訓練,其中生成式模型創建一個蒙版來修復反面示例的光照,而判別式模型則設法區分已提升品質的照片和真正的專業水準照片。與固定形狀的濾鏡(如 vignette)不同,戲劇性蒙版可感知照片內容并據此相應地調節照片亮度。GAN 訓練的競爭特性將促使這些建議逐步改善。您可以閱讀我們的論文,了解此訓練的詳細信息:
https://arxiv.org/abs/1707.03491
成果
下面展示了我們的系統通過 Google 街景制作的一些照片。正如您所看到的,通過應用經過訓練的美學濾鏡產生了一些戲劇性效果(包括本文開頭所使用的圖片!)
▲ 加拿大賈斯珀國家公園
▲ 瑞士因特拉肯
▲ 意大利 Park Parco delle Orobie Bergamasche。
▲ 加拿大賈斯珀國家公園
專業評估
為了判斷我們的算法有多么成功,我們設計了一個類似“圖靈測試”的實驗:我們將我們制作的照片與其他不同品質的照片混在一起,并將它們展示給多位專業攝影師。要求這些攝影師為每張照片的品質打分,評分標準如下:
- 隨手一拍的照片,根本不考慮構圖和光線等。
- 沒有攝影背景的普通大眾拍攝的好照片。沒有突出的藝術特色。
- 半專業水準。有明顯藝術性的優秀照片。拍照者正朝著專業攝影師發展。
- 專業水準。
下圖中,每條曲線分別顯示了專業攝影師給預測分數在特定范圍內的照片的評分。對于我們制作的預測分數很高的照片,約有 40% 的照片獲得的評分在“半專業水準”到“專業水準”之間。
▲ 專業攝影師為具有不同預測分數的照片給出的評分
未來工作
街景全景照片可作為我們項目的測試平臺。將來,這種技術甚至能夠幫助您在現實世界里拍出更好的照片。我們編譯了一個照片展示平臺,用以展示令我們滿意的照片:
https://google.github.io/creatism
如果您看到您喜歡的照片,您點擊它即可顯示附近街景的全景照片。假如您當時就在那里舉著相機,您能拍出相同水準的照片嗎?
致謝
這項工作由 Google Research 的機器感知工程師 Hui Fang 和 Meng Zhang 合作完成。我們在此感謝 Vahid Kazemi,感謝他前期在使用 Inception 網絡預測 AVA 分數方面的工作,也感謝 Sagarika Chalasani、Nick Beato、Bryan Klingner 和 Rupert Breheny,感謝他們在處理 Google 街景全景照片方面給予的幫助。同時我們要感謝 Peyman Milanfar、Tomas Izo、Christian Szegedy、Jon Barron 和 Sergey Ioffe,感謝他們建設性的評價和評論。最后我們萬分感謝匿名的專業攝影師們,感謝他們的無私奉獻!
【本文是51CTO專欄機構“谷歌開發者”的原創稿件,轉載請聯系原作者(微信公眾號:Google_Developers)】