本地人工智能:智能手機時代的低功耗分析
人工智能有一個瓶頸問題。它基于深度神經網絡,可能需要數億到數十億次計算——這是一項處理和能源密集型任務。然后是將數據從內存中移入或移出以執行這些和其他分析計算的成本和延遲。麻省理工學院(MIT)副教授Vivienne Sze因其在開發視頻壓縮標準方面的作用而聞名,該標準至今仍在使用。現在,她專注于設計更高效的深度神經網絡來處理視頻,以及更高效的硬件來在智能手機、嵌入式設備、微型機器人、智能家居和醫療設備上運行人工智能應用程序。
在麻省理工學院最近的一次采訪中,她解釋了為什么我們現在需要低功耗人工智能。“人工智能應用正在向智能手機、微型機器人、互聯網連接設備和其他功率和處理能力有限的設備轉移。挑戰在于人工智能具有很高的計算要求。將分析應用于自駕汽車的傳感器和攝像頭數據可能會消耗約2500瓦,但sm的計算預算很低artphone大約只有一瓦。”
Sze說,在智能手機等小型設備上本地化人工智能“意味著數據處理不再需要在云端、倉庫服務器機架上進行”。“從云上卸載計算使我們能夠擴大人工智能的影響范圍。它通過減少與遠程服務器通信造成的延遲來加快響應時間。這對于交互式應用程序(如自主導航和增強現實)至關重要,因為它們需要對不斷變化的條件做出即時響應。在開發設備上處理數據ice還可以保護醫療和其他敏感記錄。數據可以在收集的地方進行處理。”
從硬件角度來看,Sze尋求“在本地重用數據,而不是將其發送到芯片外。將重用數據存儲在芯片上使處理過程極為節能。”在軟件方面,Sze正在設計算法代碼的“剪枝”,以去除深層網絡中的能源密集型“權重”,并進行其他調整。她正在研究的一個潛在應用是眼動跟蹤,以幫助診斷神經退行性疾病,這可以通過患者家中的普通智能手機來完成,而到目前為止通常需要昂貴的辦公室設備。