超膽俠來了!「蝙蝠感知」AI讓智能手機聽聲生成3D圖像
英國科學家現在找到了一種方法,可以讓智能手機和筆記本等日常物品具備類似蝙蝠的環境感知能力,像超膽俠一樣厲害。
格拉斯哥大學的計算機科學家和物理學家在《物理評論快報》雜志上發表的一篇論文中概述了這項研究,它可以應用于安全和醫療保健領域。

這項技術的核心是一種復雜的機器學習算法,它利用反射回聲來生成圖像,類似于蝠使用回聲定位進行導航和狩獵的方式。
研究人員提出的算法能夠測量揚聲器發出的聲音片段或小天線發出的無線電波脈沖在室內空間內發射并返回到傳感器所需的時間。
通過巧妙地分析結果,該算法可以推斷出一個房間的形狀、大小和布局,以及挑選出存在的物體或人。
結果以視頻形式顯示,將回聲數據轉化為三維視覺。

這一研究成果與蝙蝠的回聲定位之間的一個關鍵區別是,蝙蝠有兩只耳朵來幫助它們導航,而該算法被調整為與從單點收集的數據一起工作,如麥克風或無線電天線。
研究人員表示,「該技術可用于通過潛在的任何配備有麥克風和揚聲器或無線電天線的設備來生成圖像。」

Turpin博士表示,動物的回聲定位是一種了不起的能力,科學已經成功地以多種不同的方式重新創造了從反射回聲中生成三維圖像的能力,如RADAR和LiDAR。
這項研究與其他系統的不同之處在于:
首先,它只需要來自單一輸入的數據、麥克風或天線就能創建三維圖像。
其次,算法可以將任何具有這兩件裝備中的任何一件的設備變成回聲定位設備。

這意味著這種三維成像的成本可以大大降低,開辟許多新的應用。
比如,通過接收入侵者反射的信號,可以在沒有攝像機的情況下保證建筑物的安全。
同樣的方法也可以用來追蹤養老院中虛弱病人的行動。
甚至可以將系統用于跟蹤醫療機構中病人胸部的起伏,提醒工作人員注意他們的呼吸變化。

該論文概述了研究人員如何使用筆記本電腦的揚聲器和麥克風來產生和接收千赫茲范圍內的聲波。
他們還使用天線對千兆赫茲范圍內的無線電頻率聲音進行了同樣的處理。
在每次試驗中,研究人員都收集了一個人在房間里走動時對聲波的反射的數據。
同時,他們還使用一個特殊的相機記錄了房間的數據,該相機使用一個被稱為飛行時間的過程來測量房間的尺寸并提供一個低分辨率的圖像。

通過結合來自麥克風的回聲數據和來自飛行時間相機的圖像數據,研究小組在數百次的重復中訓練了他們的機器學習算法,將回聲中的特定延遲與圖像聯系起來。
最終,該算法已經學會了僅從回聲數據中生成它自己的高度準確的房間及其內容的圖像,使它具有感知周圍環境的蝙蝠式能力。
這項研究建立在英國這一研究團隊以前的工作基礎上,訓練了一種神經網絡算法,通過使用單像素檢測器測量閃光的反射來建立三維圖像。
Turpin博士補充道,「我們現在已經能夠利用光和聲音證明這種算法機器學習技術的有效性,這非常令人激動。很明顯,這里有很多以新方式感知世界的潛力,我們渴望繼續探索未來生成更多高分辨率圖像的可能性。」