不可見成為可見!超材料和 AI 融合,洛桑聯邦理工「破譯」了聲音圖像
本文轉自雷鋒網,如需轉載請至雷鋒網官網申請授權。
聲音在空氣中作了一幅我們看不見的畫,人們需要用一些手段將其顯現出來。
聽上去有點玄幻,能做到嗎?
能!
近日,瑞士洛桑聯邦理工學院波工程實驗室(Laboratory of Wave Engineering,EPFL)的一個小組利用超材料結合深度學習技術的創新思路實現了這個過程。
2020 年 8 月 7 日,該研究小組題為 Far-Field Subwavelength Acoustic Imaging by Deep Learning(基于深度學習的遠場聲學亞波長成像)的成果發表于國際頂級物理學期刊 Physical Review X。
衍射極限帶來的挑戰
該小組的這一嘗試要從物理學中的「衍射極限」(Diffraction limit)說起。
衍射是一個我們日常生活中都遇到過的物理現象——波遇到障礙物時會偏離原本的直線傳播。而在此基礎上的衍射極限則是指,受到衍射現象的限制,一個物點經光學系統成像,并不能得到理想像點。
利用一個物體的成像,人們能夠對它傳播或輻射的光波、聲波進行一個所謂的遠場(far-field)分析,以此來描繪物體本身。
為實現這一目的,較為關鍵的一個因素是成像的分辨率。分辨率受限于波長,波越短,分辨率越高。
也就是說,正是因為衍射極限,物體的成像質量會受影響。因此,遠場觀察、識別那些尺寸比光波長小得多的物體,這項任務具有挑戰性。
雖然科學家們此前已經設計出了幾種方法來克服這種限制,但這些方法還存在一些問題,比如:
-
侵入性標記方法:需要復雜、昂貴的光學設備,圖像后處理過程繁瑣;
-
諧振超材料透鏡方法:雖然無需標記、成像分辨率也高,但諧振金屬材料對吸收損耗敏感,這在很大程度上阻礙了其實際應用。
超材料與深度學習的結合
對于任何一項科學研究而言,發現問題之后,就要提出研究課題,嘗試給出解決方案了。
研究小組在論文中表示:
機器學習在不斷進步,不同領域的科學家們開始嘗試通過深度學習進行研究,如工程、生物、醫學、量子物理等。近年來,深度學習成功的例子包括醫學圖像分析、語音識別、圖像分類、逆成像問題以及各種復雜的分析問題。
實際上,由具有非線性模塊的多個處理層組成的深度神經網絡,能夠通過自調整每一層的內部參數,發現、學習隱藏在復雜數據中的結構,無需人工干預。
受此啟發,波工程實驗室研究小組的思路是:將超材料與深度學習技術結合,把衍射極限由劣勢變成優勢,為無標記成像技術的新應用開辟一條新路。
雷鋒網了解到,超材料即 Metamaterial,是指一類自然界中不存在的、人工制造的非活體復合材料或結構。在這一研究中,小組采用的是有損耗(小組特地進行的設計)的諧振金屬。
【用于亞波長圖像重建和識別的實驗裝置】
研究小組在亞波長輸入圖像(subwavelength input images)附近放置金屬,并訓練神經網絡直接對圖像進行重構和分類。其中,金屬的吸收損失是有效學習的關鍵。
具體原理見下圖:
類似數字“5”的形狀是一個亞波長聲源。
如 a 部分所示,放置在遠場中的麥克風陣列捕獲的信號不包含關于聲源的亞波長細節的任何信息,換句話說,不管使用什么信號處理策略,都不可能實現成像。
如 b 部分所示,隨機插入了一簇亞波長亥姆霍茲諧振器之后,關于亞波長細節的信息輻射到了遠場中。
如 c 部分所示,小組將麥克風陣列采集到的遠場幅值和相位輸入到神經網絡中。
小組使用了兩種不同類型的神經網絡,一是 U -net 型卷積神經網絡,用于圖像重建;二是多層并行 CNN,用于圖像分類。
分辨率和分類精度的顯著提升
實驗結果表明,在沒有金屬元素的情況下, U -net 型卷積神經網絡難以重建圖像;而多層并行 CNN 的分類性能相對較高,近場和遠場分別為 67.5% 和 57.5%。
而在加入 ñ=29 有損諧振器的情況下,遠場分類精度從 57.5% 提高到 74%,不過圖像重建仍然質量較低(下圖第一行)。
在加入 ñ=302 有損諧振器的情況下,不僅整體分類精度提高到了 84%,而且亞波長圖像的重建也非常準確,分辨率提高到了 30 倍(下圖第二行)。
在初步證明了神經網絡能夠從遠場中記錄的幅度相位分布恢復初始的亞波長圖像之后,該小組又有了一個新目標:證實該網絡在新數據庫中快速重新學習的能力。
據了解,研究小組創建了一個包含 600 個培訓樣本和 200 個測試樣本的新數據集,其中包含四個字母 E、 F、L 和 P,然后在這個新的、較小的數據集上重新訓練 U -net 型卷積神經網絡,要求神經網絡對數據集中的未知字母進行分類和重構。
如上圖所示,經過重新學習的網絡實現了 ≥0.94 的圖像保真度(這里指輸入字母和重構字母之間的差異),說明這種方法具有高度適應性,在學習新數據類型時可以更加高效,不受輸入數據多樣性的限制。
論文合著者之一 Romain Fleury 強調了這一方法的獨特性:
通過使用長度大約為一米的聲波,生成分辨率僅為幾厘米的圖像,我們遠遠超過了衍射極限。與此同時,超材料吸收信號曾被認為是一個很大的缺點,但事實證明,與神經網絡相結合時,它成了一種優勢。
實際上研究小組還認為,這一方法能在聲學圖像分析、特征檢測、對象分類中進行應用,或是在生物醫學應用中作為一種新型無標記聲學傳感工具。正如論文合著者之一 Romain Fleury 所說:
在醫學成像領域,使用長波來觀察非常小的物體將會是一個重大突破。長波意味著醫生可以使用更低的頻率,即便面對著致密的骨組織,也能獲取到有效的聲學成像。