看隱私計算如何保護你的數據安全?
作者 | 蒲語彤,單位:中國移動智慧家庭運營中心
?Labs 導讀
近期一則新聞爆出,知名社交軟件Twitter因安全漏洞被黑客入侵,有超過540萬個賬戶的聯系方式泄露。每年關于數據泄露的事件屢見不鮮,這僅僅是眾多數據泄露新聞中具代表性的一條。
隨著移動互聯網的迅猛發展,數據在當今數字經濟時代發揮不可或缺的作用。互聯網用戶享受著大數據應用所提供的個性化服務,為生活帶來了極大的便利。但由于數據本身具有敏感性、隱私性等特性,在數據的采集、存儲、傳輸、使用和分析的過程中,隨時面臨著泄露風險。大數據采集的信息包括聯系方式、地理位置、興趣愛好、身份等敏感信息,這些個人隱私信息一旦泄露將帶來不可估量的安全隱患。
因此,越來越多的政府、組織和企業開始重視隱私保護問題,如何從源頭上防止隱私泄露,隱私計算的出現為數據安全提供了解決方案。
1 什么是隱私計算
2016年,隱私計算概念在《隱私計算研究范疇及發展趨勢》中被正式提出,其被定義為“面向隱私信息全生命周期保護的計算理論和方法,是隱私信息的所有權、管理權和使用權分離時隱私度量、隱私泄漏代價、隱私保護與隱私分析復雜性的可計算模型與公理化系統。”
簡單來說,隱私計算是指在保護數據本身不對外泄露的前提下實現數據分析計算的技術集合,達到對數據“可用、不可見”的目的;在充分保護數據和隱私安全的前提下,實現數據價值的轉化和釋放。
2 隱私計算的政策現狀
數據安全是數據的基礎性需求,數據隱私則是建立在數據安全基礎之上的數據價值理念。
針對數據安全與隱私問題,國內外近幾年已初步形成了由法律法規、規范性文件及技術標準等組成的多層次法律政策體系,為隱私計算技術發展提供了有利的政策背景,強化了數據安全保障。
圖1 國外隱私相關法律法規
近年來,我國的隱私問題也從理論上落地實現,相關話題從懵懂的意識、社會討論、共識逐漸生成,最終到立法機構推動、行業標準形成、約束機制等方面落地。
圖2 中國隱私計算相關政策
如圖2所示,我國陸續出臺多部重要法律,逐步隱私保護的法律。其中,與數據隱私、數據安全相關的法律法規主要有三部:2017年生效的《網絡安全法》、2021年9月生效的《數據安全法》和2021年11月開始實施的《個人信息保護法》。這三部法律全面構筑起了國內數據安全領域的法律框架,共同確立了國內數據隱私、數據安全的法律框架主題,分別在網絡安全管理、數據安全與發展、個人信息處理權利義務等領域做了界定與規定,確保數據流轉的安全、隱私有法可依。
3 隱私計算技術
隱私計算是一個新興的跨學科綜合技術,涉及密碼學、機器學習、硬件、BI 分析等。目前,隱私計算技術通常分為以下四種:安全多方計算、聯邦學習、可信執行環境、多方中介計算。
3.1 安全多方計算(MPC)
安全多方計算(Secure Multi-party Computation)即在參與方不共享各自數據且沒有可信第三方的情況下,仍可以進行協同計算,最終產生有價值的分析內容。
安全多方計算要確保輸入數據的獨立性、傳遞數據的準確性以及計算過程的正確性,同時不能把輸入值泄露給參與計算的其他成員。此外,它在數字簽名、電子拍賣、秘密共享、門限簽名等場景中有著重要的作用。
3.2 聯邦學習(FL)
聯邦學習(Federated Learning)也被稱為聯邦機器學習、聯合學習,是一種分布式機器學習技術或框架,最初是由谷歌提出的。
其實現了在本地原始數據不出庫的情況下,通過對中間加密數據的流通和處理來完成多方聯合的學習訓練。目前聯邦學習技術通常與安全多方計算技術以及區塊鏈等技術相結合。
3.3 可信執行環境(TEE)
可信任執行環境(Trusted Execution Environment)是一種具有運算和儲存功能,并且能提供安全性和完整性保護的獨立處理環境。在該環境內的程序和數據,能夠得到比操作系統層面更高級別的安全保護。
其實現原理是通過軟硬件方法, 在中央處理器中,構建出一個安全區域,計算過程執行代碼TA(Trust Application)僅在安全區域分界中執行,外部攻擊者無法通過常規手段獲取和影響安全區的執行代碼和邏輯,以此來實現敏感數據的隱私計算。
3.4 多方中介計算(MPIC)
多方中介計算(Multi-party Intermediary Computation)是由譚立、孔俊提出的一種新的隱私計算方法,是指多方數據在獨立于數據方和用戶的受監管中介計算環境內,通過安全可信的機制實現分析計算和匿名化輸出的數據處理方式,是一個計算管理系統。在MPIC中,數據方的原始數據由其去標識化后輸入中介計算環境或平臺參與計算,完成計算后立即被刪除,匿名化數據經審核后按指定路徑輸出。在MPIC的特定環境和規則下,信息數據的身份標識經過加密和標識化的處理,因其算法具有不可逆性,故無法恢復為原始數據,滿足了匿名化的一個要求,即不能復原;同時,由于這些去標識化的信息數據被封閉在特定受監管環境或平臺中,客觀上達到了匿名化的另一個要求,即無法識別特定自然人。故被處理的數據實質可視同匿名化,不再屬于個人信息,無需征得個人同意就可進入中介計算環境或平臺參與計算。
不同技術往往組合使用,在保證原始數據安全和隱私性的同時,完成對數據的計算和分析任務。
4 隱私計算的價值
互聯網用戶每時每刻都在產生數據,以及與數據打交道,數據已經與我們每個人乃至整個社會的方方面面都密切相關。保障數據的安全以及對于數據的隱私保護就成為了當下亟需解決的訴求。
對于個人來說,我們的個人信息與所產生的數據如果被泄露,可能會帶來身份盜用,財產損失,親友被騙,嚴重的甚至會威脅到生命安全。
對于企業來說,數據是企業的命脈之一。經營數據涉及到商業機密,一旦泄露對于企業的經營可能造成毀滅性的打擊。而企業掌握的用戶數據一旦泄露,同樣會給企業帶來巨額的損失。
對于國家來說,數據的安全是直接關系到國家的安全,沒有數據安全,國家層面的數據主權就無從建立。
而隱私計算是數據安全與隱私保護的最優解決方案之一,它既可以從保證數據在行業的各個組織之間發生交互過程中的安全和隱私,又能打消個人或者組織對于數據安全性的擔憂。通過引入隱私計算,保證關鍵數據能夠在安全且保護隱私的環境下共享出來,高效地參與到更多的社會活動和商業活動中,讓整個社會的運轉能夠降本增效,釋放數據資產的價值,帶動經濟增長。
5 隱私計算的應用
隱私計算技術應用行業廣泛,對于金融、通信、政務、醫療等行業都具有重要的現實意義。
由于隱私計算技術涉及多門學科,相對來說上手門檻高,但我國目前已有不少平臺將其隱私計算技術進行分層設計并且開源,例如螞蟻集團開源的可信隱私計算框架「隱語」。這無疑是降低準入門檻,開發者們可以平滑切換各種技術進行體驗或開發。
從政策文件的密集出臺,到資本的投入,隱私計算終于出現在主流大眾面前,并收獲了各行各業的諸多關注,越來越多的企業開始結合隱私計算技術研發產品。
自2019年起,隱私計算的落地需求呈現出遞增趨勢,市場層面從落地初期驗證階段進入加速落地階段。隨著需求的落地和政策層面的支持,隱私計算計可以釋放更多的數據資產價值,帶動經濟增長,在社會經濟中發揮越來越重要的作用。
參考文獻
[1] 隱私計算聯盟、中國信通院云大所-隱私計算白皮書(2021年).
[2] 中國紀檢監察報-什么是隱私計算?.
[3] 經貿實踐-多方中介計算:一種新的隱私計算方法.