細思極恐!1億網友被騙,AI已經學會了“易容術”
近日,一段通過 AI 技術把朱茵在《射雕英雄傳》中扮演的角色“黃蓉”的臉替換成楊冪的視頻在網絡引起熱議。
這是朱茵飾演的黃蓉:
替換成楊冪后:
還是朱茵活靈活現的表情,但五官已然變成了楊冪,視頻看起來毫無破綻,簡直讓人以為就是本冪演的了。
網友都被這樣的操作驚呆了,微博話題閱讀量瞬間飆到 1.3 億。
這種換臉術看起來“好玩”,但有網友質疑是否侵犯肖像權。
27 日,楊冪“換臉”視頻的制作者回應,制作視頻的本意是用于技術交流,并無營利行為,但已將相關視頻下架,并表示:“對所有人來說是一個警示,大家應尊重版權與肖像權,專注于技術本身。”
這種神奇的黑科技被稱作 AI 換臉!然而,如此高階的換臉技術引來了無數網友的恐慌,“怎么實現的換臉?如果這一技術被用在其他地方,會怎么樣?我會不會被別人假冒了都不知道?目前的人臉識別技術還安全嗎?”
可怕的換臉 AI 技術
其實 AI 換臉兩年前從國外論壇流傳開來,而國內也有不少仿效者,比如有網友把女主播的臉,換成唐嫣、楊冪、劉亦菲等明星。
是不是覺得很震撼?人工智能正在以我們所有人想象不到的速度,飛速前進,顛覆我們以往的認知.....
換臉哥制作這段逼真視頻的工具叫 Deepfake ,這一 AI 技術在國外已經火了兩年多。
當年,美國國防部把這項技術譽為人類對于 AI 的軍備競賽的一個開端,能把視頻中的人臉換成其他人,同時保持臉部肌肉運動和諧,口型和聲音匹配。
什么是 DeepFakes?
最初,在 Reddit 網站上,一位用戶名為“deepfakes”的網友發布了自己制作的換臉視頻,將影片的女主角換成了神奇女俠,短時間吸引了大量的人氣,廣大網友順理成章地把他的網名作為這項技術的命名。
《神奇女俠》的扮演者蓋爾·加朵的這一面你見過么?其實這是一段合成視頻,視頻中并非蓋爾·加朵本人。
而是通過機器學習技術搭建了一個系統,讓 AI 學習了女明星的面部特征,然后合成到了成人片里的女演員的頭部。
沒過多久,同名算法在 GitHub 開源,由 deepfakes 技術制作的視頻在網上也越來越多。杰西卡·阿爾芭、艾瑪·沃特森等好萊塢明星紛紛被“換臉”。
除了 Reddit 上的討論外,在 2018 年 1 月,還有人推出了 Windows 程序的 FakeApp,這大大降低了 DeepFake 的使用門檻,它允許用戶很輕松地自制換臉視頻,即使你沒有任何人工智能方面的知識。
但是由于許多用戶將 deepfakes 技術用于制作虛假視頻,例如偽造政治家公開演講,導致這項技術聲名狼藉。
DeepFakes 實際上是一種人臉交換技術,顧名思義,也就是在圖像或視頻中把一張臉替換成另一張臉。
事實上,人臉交換技術在電影制作領域已經不是個新鮮詞了,但是之前電影視頻中的人臉交換非常復雜,專業的視頻剪輯師和 CGI 專家需要花費大量時間和精力才能完成視頻中的人臉交換。
這是《速度與激情 7》里的保羅,他在電影沒殺青之前就意外去世,著實令人心痛。但后期通過一種 CGI 的技術換臉呈現出來了,這才讓我們看到了分叉口永別的這一幕。
DeepFakes 的出現可以說是人臉交換技術的一個突破。利用 DeepFakes 技術,你只需要一個 GPU 和一些訓練數據,就能夠制作出以假亂真的換臉視頻。
這可以說是一個非常了不起的突破了,因為你只需要把上百張人物的樣圖輸入至一個算法,就能完成人臉交換,制作出非常逼真的視頻效果。就算你是個對視頻剪輯一竅不通的外行,也能做到這樣。
DeepFakes 的出現還意味著我們可以在視頻中進行大規模的“換臉”。我們大多數人都曾經把自己的照片上傳到網絡上,因此,我們大多數人的臉都能夠輕易地被替換到一些視頻中,成為視頻的“主角”。
不得不說,這是件非常可怕的事情,但這也并不那么值得恐慌,畢竟我們大家早已接受了“照騙”(照片造假)。
DeepFakes 的技術原理
DeepFakes 的核心是一個“自動編碼器”,這個“自動編碼器”實際上是一個深度神經網絡,它能夠接收數據輸入,并將其壓縮成一個小的編碼,然后從這個編碼中重新生成原始的輸入數據。
在這個標準的自動編碼器設置中,網絡將嘗試學習創建一個編碼,從中網絡能夠重新生成輸入的原始圖片。只要有足夠多的圖像數據,網絡就能學會創建這種編碼。
DeepFakes 讓一個編碼器把一個人臉壓縮成一個代碼和兩個解碼器,一個將其還原成人物 A(Fallon),另一個還原成人物 B(Oliver)。
下面的圖能夠幫助你理解:
在這個案例中,使用的編碼器是一樣的,但是 Fallon 和 Oliver 的解碼器是不同的。
在訓練的過程中,輸入的人臉會被扭曲,從而模擬一個“我們希望得到這樣的人臉”的概念。
下面介紹算法訓練的三個步驟:
- 首先,我們給編碼器輸入了一張 Jimmy 扭曲臉的圖片,并嘗試用解碼器 A 來重新還原他的臉,這就使得解碼器 A 必須要學會在紛繁復雜的圖片中識別并且還原出 Jimmy 的臉。
- 然后,把 Oliver 扭曲臉的圖片輸入至同一個編碼器,并用解碼器 B 來還原 Oliver 的臉。
- 我們不斷重復上面的操作,直到兩個解碼器能夠分別還原出兩個人的臉,同時編碼器也能夠學會通過抓取人臉關鍵信息,從而分辨出 Jimmy 和 Oliver 的臉。
等到以上的訓練步驟都完成以后,我們就能把一張 Jimmy 的照片輸入至編碼器,然后直接把代碼傳輸至解碼器 B,將 Jimmy 的臉換成 Oliver 的臉。
這就是我們通過訓練模型完成換臉的全過程。解碼器獲取了 Jimmy 的臉部信息,然后把信息交給解碼器 B,這時候解碼器 B 會作出這樣的反應:“這又是一條干擾信息,這不是 Oliver 的臉,那么我就把你換成 Oliver 吧。”
一條算法僅通過觀察許多圖片就能夠再次生成、還原這些圖片,這聽起來挺不可思議的,但 DeepFakes 確確實實做到了,而且效果還相當不錯。
為避免徹底淪落,Reddit 無奈只得關掉了 Deepfake 頻道,其 GitHub 開源代碼也被清除。
Twitter 火速刪除了相關內容,并且封禁了相關內容的搜索。FakeApp 的官網目前也已無法使用。
2019 年 1 月,荷蘭 DeepTrace 實驗室發布了一份 DeepFake 發展報告,數據顯示 2018 年“deepfake”關鍵詞的谷歌搜索次數比 2017 年增長了 1000 倍。
在 deepfake 誕生之前,視頻換臉技術主要應用于電影拍攝中,而且它需要相對較高的技術和資金投入。
但現在,deepfake 等深度學習技術的出現大大降低了換臉門檻,使用者不僅用它來捏造針對政要人士的假新聞。
這些假視頻、假新聞的危害性之大這里就不贅述了。而且 deepfake 去年甚至驚動了美國五角大樓。
他們通過美國國防部高級研究計劃局(DARPA)委托全美各地的專家,想方設法檢測各類視頻的真實性。
不久后,DARPA 就研發了一款能夠自動監測出被換了臉的假視頻的 AI 工具,根據假視頻一般不會表現出眨眼、呼吸和眼球運動這些特征,能夠以 99% 的準確率識別出假視頻。
相關論文和數據集:
如今這項技術正在被越來越多人使用,而且用途不明。在這種前沿技術面前,每個人都可能成為潛在的受害者。
一旦被人濫用,真實照片與語音模擬器或語音合成系統相結合,就可以生成任意“假新聞”,任何人可以變成任何人。
如今,眼見已經不為實,對于泛濫的消息,我們還需加強鑒別,切莫人云亦云。
那些由于技術濫用對當事人造成的傷害,對整個社會造成的反噬,是人類對新技術缺乏敬畏必須付出的代價。
技術從來都是雙刃劍。讓技術進步真正成為我們的鎧甲,而非軟肋,還需要更健全的、與時俱進的規則與法律的保護。
“圖之于未萌,慮之于未有”。新技術的出現,不斷沖擊著我們的法律觀、道德感,提高應對能力,在可能到來的風險面前做好準備,才能讓新技術始終行駛在正確的軌道里,不會沖出道德、法律的“籬笆”。