宅男大叔自學AI打造大師級水準,火爆推特
本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。
最近,一位日本宅男大叔佐藤做了一個AI生成肖像畫的網站AI Gahaku,10天內用戶訪問量從0暴增到100萬,引爆推特。
簡單易操作,上傳一張人臉照片,就能生成一張大師級肖像畫。

而比技術更神奇的是佐藤自己,因為他是自學AI做出來的,不得不佩服的宅男創造力。
佐藤患有阿斯伯格癥——也被俗稱成“社交恐懼癥”,名副其實的天才病,一般來說,此類患者會在某個領域具有特殊潛能,但不適應普通人的生活。
當然,佐藤的技能點就點在了AI上。

pix2pix,TensorFlow內置的cGAN模型
讓大叔此次聞名的AI技術,就是是大名鼎鼎的GAN的變種。
此次的人臉肖像畫生成技術,就是大叔在TensorFlow內置的cGAN(條件生成對抗網絡)中的pix2pix模型上改造而來。
不同于GAN的技術通用性,cGAN更強調特定場景下的發揮,比如AI Gahaku,就只能針對人臉,如果用戶上傳的是貓臉,則是無法生成結果的。
GAN的特點在于損失函數的自行計算和自動更新,這使得GAN本身具有和遷移學習結合的潛質,在近年來的發展路徑上看,更多是把GAN當做手段,去實現遷移學習提出的目標,遷移學習為應用GAN提供具體指向。
TensorFlow的內置pix2pix的是基于cGAN的圖像對圖像翻譯的模型,模型本身已經成熟,直接調用便可運用到對黑白圖像著色、圖像風格變化等場景的使用上來。
具體到大叔的使用上,利用pix2pix模型,大叔其實是將模型限定在大師肖像畫的生成上,這也體現了模型本身強大的擴展性。
如何使用,都取決于你自身。
在佐藤的另一款作品PixelMe中,同樣使用pix2pix技術,但是生成的是8bit的像素風格頭像,一個模型,多種用途。

當然,實際效果因人而異,畢竟嚴格來說,大叔是在對既有模型進行二次開發,原有的算法和數據結構并未改變,因此性能和效果受到原有模型的限制。
宅男的AI進階之路
大叔人生經歷可以說復雜,從大學退學后,先后干過面包師,參加過護士學校培訓課程,但覺得都都不太適合自己,直到他決定運用自己的才智,投身到AI的事業當中去。
那說干就干,就從TensorFlow學起吧。
借助Google Colab的算力資源,大叔從頭按著TensorFlow教程學起,不過大叔也確實適合干AI,而不是去蒸糕點。
在學習過程中,佐藤找到了適合自己的方向,遷移學習和GAN,可以較好的實現圖像的再生成,使用不同的圖像訓練數據集,可以針對具體場景進行學習和生成。
GAN屬于典型的非監督學習方法,核心原理是讓兩個神經網絡進行“對抗”,通過不斷優化參數來得到最優結果,自我博弈。
這種技術主要用在計算機視覺領域,這也是佐藤選擇GAN的主要原因。
得益于Google的慷慨,大叔使用的網站服務器和算力資源都較為便宜,大約為一天20美刀,大叔表示,在可接受的能力范圍之內,短期不會尋求商業化。
AI for Everyone!
在紅了之后,大叔也沒飄。
他認為這是在做自己感興趣的東西,而不是為了經濟利益。
出于對技術的熱愛,佐藤開始了自己的AI之路,并在兩年之后便能上線應用。
這份為夢想而不懈努力的奮斗精神,才是真正值得我們學習的。
畢竟,不是每個人有勇氣去自學AI。