挑選一種顏色,這個AI系統就能設計出標識
譯文LoGAN設計出來的幾個標識(logo)
圖片來源:馬斯特里赫特大學
【51CTO.com快譯】生成式對抗網絡(GAN)是一種分兩部分的神經網絡,包括生成樣本的生成器(generatorr)和試圖辨別生成樣本與真實樣本的鑒別器(discriminator)。GAN應用于眾多領域,比如發現新藥物、做出栩栩如生的漢堡和蝴蝶照片,并生成腦部腫瘤的合成掃描。正如荷蘭馬斯特里赫特大學發表的一篇新論文揭示的那樣,GAN在設計標識方面同樣也不錯。
在發表于預印本服務器Arxiv.org上的研究報告(《LoGAN:用顏色方面調節的生成式對抗神經網絡設計標識》,https://arxiv.org/pdf/1810.10395.pdf)中,科學家們描述了一種名為LoGAN的人工智能(AI)系統,可以用12種不同的顏色設計標識。
他們寫道:“對任何設計師來說設計標識是一個漫長、復雜而費錢的過程。然而,最近生成式算法方面的進步提供了模型,有望給出一種可行的解決方案。LoGAN的結果首次展示了人工智能如何用于幫助設計師進行創作,為未來指明了大有前景的方向,比如包括描述性更強的標簽,從而有望提供一種更詳盡、更易使用的系統。”
研究人員解釋道,這種GAN的問題在于,它們并不總是獲得美觀的結果。它們的解決方案是使用最顯眼的顏色來定義標識:黑色、藍色、棕色、青色、灰色、綠色、橙色、粉紅色、紫色、紅色、白色和黃色。
該團隊拿LDD-icons數據集來訓練系統,該數據集由486777個小圖標組成,這些小圖標的尺寸是32 x32像素。每個小圖標中的主顏色用算法加以提取,并由RGB值轉換成顏色詞。同時,系統中的第三個神經網絡(除了生成器和鑒別器外)對樣本圖像進行分類。
那么,LoGAN會怎么做?盡管生成的標識很模糊(歸咎于源圖像的低分辨率),有些標識還是相當逼真。饋入顏色關鍵字后,LoGAN設法給出不規則的形狀、圓形和方形按鈕,甚至給出類似谷歌Chrome標識的外觀。
有趣的是,白色和灰色是12個顏色類別中最常見的三種顏色組合之一。在橙色類別中,棕色是神經網絡的首選,而在黃色類別中,它通常采用藍色。
研究人員認為,像LoGAN這樣的AI系統可以處理標識設計中一些比較單調的工作,讓設計師能夠集思廣益。在將來的工作中,他們希望將系統對單詞的語義理解擴大到顏色之外的關鍵字,比如形狀和焦點。
他們寫道,經過改進的系統可以拿兩個不同的數據集來訓練:一個數據集包含有著明顯幾何形狀的標識,另一個數據集包含非規則形狀的標識。它還可能使用一個嵌入模型,最常用的單詞描述標識以“提高可解釋性”。
研究人員寫道:“雖然生成的標識其分辨率非常低,但它們可以用作最終標識的初稿,或為設計師賦予靈感。如果饋以某個關鍵字(在我們的例子中包括標識中最顯眼的顏色),提議的模型就能成功地設計出標識。這一類關鍵詞可以被認為是描述性的,因為它提供了人類易于區別的標識屬性。”
值得一提的是,利用AI的強大功能來制作美工不是什么新想法。Botnik Studios從亞馬遜的Alexa Accelerator計劃出來,最近教一個神經網絡制作一張諷刺性的科切拉音樂節(Coachella)海報,海報上列出了一系列虛構的樂隊名稱。Prisma這款流行的智能手機應用軟件使用名為風格轉換(style transfer)的機器學習技術,讓照片看起來如同油畫。而游戲設計AI初創公司Promethean AI使構建虛擬景觀和室內設計的過程實現了自動化。
原文標題:Pick a color and this AI system will craft a logo,作者:Kyle Wiggers
【51CTO譯稿,合作站點轉載請注明原文譯者和出處為51CTO.com】