機(jī)器人會模仿人類微笑了,但我總覺得這笑容……
本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。
機(jī)器人只能用一張撲克臉、上面兩只空洞的塑料珠子來面對人類嗎?
不一定,它也可以沖你微笑!
下面這個擁有著柔軟面部的“小藍(lán)人”,可以模仿人類的微笑等表情。
就像這樣:

“尬笑”、“齜牙咧嘴”……一改機(jī)器人“冷若冰霜、呆若木雞”的形象。
可一向由金屬或硬塑料制成的機(jī)器人,是如何露出微笑的呢?
由線和電機(jī)組成的人造“肌肉”
哥倫比亞大學(xué)(Columbia Engineering)創(chuàng)意機(jī)器實驗室(Creative Machines Lab)的研究人員一直對機(jī)器人與人類之間的互動感興趣。
面部表情在建立信任方面發(fā)揮著巨大作用,隨著機(jī)器人已經(jīng)被越來越多地用于療養(yǎng)院、醫(yī)院等與人類緊密合作的地方,相比“冷冰冰”,我們更需要靈敏、有“溫度”的機(jī)器人。
于是,研究人員花了五年時間來創(chuàng)造上面這個可以模仿人類表情、叫做 EVA的機(jī)器人。
EVA的機(jī)械設(shè)計含以下四個模塊,如下圖:
A為電機(jī)伺服模塊(motor servo module ),EVA就是由它驅(qū)動,該模塊通過底部的樹莓派4控制。“皮膚”通過尼龍繩與10個電機(jī)相連,以受到控制作出相應(yīng)表情。
B為有6個轉(zhuǎn)動角度的自由度的眼睛模塊,與前顱骨分離。
C為RGB攝像機(jī),用于人表情的隨機(jī)數(shù)據(jù)采集。
D為6自由度的頸部模塊。

其中,要想在機(jī)器人整個頭部設(shè)計出一個足夠緊湊的系統(tǒng)以適應(yīng)人類頭骨的大小,同時仍然具有足夠的功能以產(chǎn)生各種面部表情可不容易。
里面要塞下電路、傳感器和電機(jī)(motor)等各種體積不小的玩意兒。
為此,研究人員決定用3D 打印來制造形狀復(fù)雜的零件,讓這些零件在EVA 的腦瓜里無縫地集成在一起。
EVA通過由尼龍繩和電機(jī)(cables and motors)組成的人工“肌肉”,拉動臉上的特定點,模仿人類面部皮膚和骨骼上不同部位的42多塊細(xì)小肌肉的運動,來表達(dá)憤怒、厭惡、恐懼、喜悅、悲傷和驚訝六種基本情緒,甚至更細(xì)微的表情。
“有一天,當(dāng) EVA 突然給我一個大大的、友好的微笑時,我正忙著自己的事情,我知道這純粹是機(jī)械性的,但我發(fā)現(xiàn)自己條件反射地回以微笑。”
深度學(xué)習(xí)“閱讀”人類表情,作出反應(yīng)
上面的機(jī)械設(shè)計,表明EVA這個機(jī)器人在物理上具備作出各種表情的能力。那它又是如何自主完成模仿的呢?
下面就來揭開這款機(jī)器人的軟件部分。
由于人類面部表情太復(fù)雜,預(yù)先設(shè)定好的規(guī)則根本不夠隨機(jī)應(yīng)變,研究人員利用幾個深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)構(gòu)建了EVA的“大腦”。
這個大腦需掌握兩種能力:一是通過“閱讀”人類的臉知道自己要做哪些表情;二是能把這些表情通過控制面部“肌肉”而呈現(xiàn)出來。
為了教EVA認(rèn)清自己的“臉”是什么樣子,團(tuán)隊拍攝了數(shù)小時它做各種“鬼臉”的視頻。

眉毛也可以動~

然后,就像一個人類在Zoom視頻軟件里看著自己一樣,EVA的內(nèi)部神經(jīng)網(wǎng)絡(luò)學(xué)會了將肌肉運動和視頻片段中自己的臉“配對”。
EVA對自己的臉是如何“運動”有了原始的感覺后,讓它將自己與攝像機(jī)拍攝的人臉表情匹配上也就不難了。
經(jīng)過多次改進(jìn)和迭代,EVA終于獲得了從相機(jī)讀取人臉“姿勢”的能力,并通過模仿人類面部表情來做出反應(yīng)。
整個模仿過程如下:
EVA的大腦主要有兩個神經(jīng)網(wǎng)絡(luò):生成網(wǎng)絡(luò)和逆生成網(wǎng)絡(luò)(inverse network)。
給定一幅由普通RGB相機(jī)拍攝的人臉圖像后,系統(tǒng)首先用OpenPose提取面部標(biāo)志。
OpenPose,人體姿態(tài)識別項目是美國卡耐基梅隆大學(xué)(CMU)基于卷積神經(jīng)網(wǎng)絡(luò)和監(jiān)督學(xué)習(xí)并以caffe為框架開發(fā)的開源庫。
然后將人臉面部標(biāo)志標(biāo)準(zhǔn)化為機(jī)器人尺寸,將它與靜態(tài)機(jī)器人臉圖像連接到生成網(wǎng)絡(luò),生成合成表情后的機(jī)器人圖像。
逆生成網(wǎng)絡(luò)以該圖像為基礎(chǔ),輸出電機(jī)指令讓機(jī)器人執(zhí)行,最終機(jī)器人臉上浮現(xiàn)出人類表情。

再來看一組EVA的模仿:
發(fā)現(xiàn)EVA還會眨眼睛、扭脖子,但是從正面看的話表情還是有點僵硬。
研究人員指出,EVA 還只是一項實驗室實驗,只會模仿,也與真正和人類進(jìn)行面部表情交流還相去甚遠(yuǎn)。但他們相信這種技術(shù)終有一天會在現(xiàn)實世界中產(chǎn)生有益的應(yīng)用。
該研究于 2021 年 5 月 30 日在 ICRA 會議上發(fā)表,機(jī)器人的藍(lán)圖已在 Hardware-X(2021 年 4 月)開源。
關(guān)于作者
此次EVA機(jī)器人的研究團(tuán)隊主要成員一共5人,其中3名華人。
機(jī)器人軟件部分的項目領(lǐng)導(dǎo)人為Chen Boyuan,吉大本科畢業(yè),現(xiàn)哥倫比亞大學(xué)博士生,專業(yè)計算機(jī)科學(xué)與技術(shù),研究方向:機(jī)器人、計算機(jī)視覺、機(jī)器學(xué)習(xí)。
文中出鏡的小哥胡宇航 ,也是哥倫比亞大學(xué)的博士生。本科畢業(yè)于廈門大學(xué)嘉庚學(xué)院,本科期間就申請了多項國家專利,還開了公司,被稱為“科創(chuàng)達(dá)人”。
Li Lianfeng, 哥倫比亞大學(xué)機(jī)器人技術(shù)與控制機(jī)械工程碩士。
論文地址:https://arxiv.org/abs/2105.12724
項目網(wǎng)站:http://www.cs.columbia.edu/~bchen/aiface/