阿里安全開源隱私計算新技術:計算速度快20倍,通信成本低兩倍
本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。
如何在不查看圖片的前提下,幾秒之內就識別一張圖片?
這個看似在找茬的問題,卻是隱私計算領域會真實碰到的問題。
著名的“百萬富翁問題”所描述的就是這樣的場景:兩位富翁如何在不知道對方財富的前提下,比較誰的財富更多?
近年來出現出現的一些方法,比如兩方計算網絡推理(2PC-NN)可以解決上述問題,但同時又會造成大量的計算成本和通信開銷。
但現在,只要2.5分鐘,2.3GB的通信費用,就能在ResNet50的基準上進行端到端的執行。
比起現在最好的兩方計算網絡推理框架,微軟的CryptFlow2還要分別高出5.9倍和12.9倍。
目前,這項研究已經被國際四大安全頂會之一的USENIX Security Symposium 2022接收,研究團隊來自阿里巴巴。
這也是我國團隊首次在USENIX Sec22上發表安全多方計算(MPC)方向的論文,相關代碼目前已開源。
如何減少開銷?
這是一個叫做獵豹(Cheetah)的新型框架,是一個用于深度神經網絡的兩方計算網絡推理系統。
為了使系統盡量高效,現有的兩方計算網絡推理框架常常會使用多種類型的加密基元(Cryptographic Primitive)。
比如,DELPHI和CrypTFlow2就會利用同態加密(HE)來評估DNN的線性函數,而獵豹就是這樣一種混合系統。
不同的是,在設計基礎協議、如何協調不同類型的加密基元上,獵豹進行了新的改進:
- 重新設計了基于同態加密的協議,可在不需要任何輪調操作(Rotation Operation)以的情況下評估線性層(即卷積、批量歸一化和完全連接)
- 設計了幾個用于非線性函數(如ReLU和Truncation)的更加精簡,通信效率更高的基元
開發者將新的線性協議與先進技術進行比較,所有的運行都是用單線程執行,結果是計算速度最高快了20倍,通信成本最低低到2倍:
而在所有的協議和優化都完成時,在大型DNN上運行加密推理,在3分鐘內,獵豹就可以評估SqueezeNet、ResNet50和DenseNet121:
放到實際應用上:假如客戶甲有一張圖片,服務器乙需要對該圖片進行AI識別,判斷是否含有不合規的內容,但出于隱私保護要求,又不能查看甲的圖片本身。
這時,使用微軟的ryptFlow2,需要數百秒才能完成一張圖片識別。
而獵豹在保證同等的可證明安全前提下,讓速度快了5倍,數十秒就能識別。
作者介紹
論文共有兩位一作,黃智聰(Zhicong Huang)和Wen-jie Lu。
其中,黃智聰本科畢業于北京大學的計算機科學系,2018年從瑞士洛桑聯邦理工學院(EPFL)獲得博士學位。
他現在就職于阿里巴巴安全部雙子座實驗室,負責研究數據保護與共享技術,研究領域包括應用密碼學,數據安全與隱私,差分隱私,機器學習,安全計算,同態加密,隔離計算。
論文:
??https://eprint.iacr.org/2022/207??
開源地址:
??https://github.com/Alibaba-Gemini-Lab/OpenCheetah??