淺談數據安全治理與隱私計算
北京時間2022年7月21日,國家互聯網信息辦公室依據《網絡安全法》《數據安全法》《個人信息保護法》《行政處罰法》等法律法規(guī),對滴滴全球股份有限公司處人民幣80.26億元罰款,對滴滴全球股份有限公司董事長兼CEO程維、總裁柳青各處人民幣100萬元罰款。滴滴公司存在過度收集用戶隱私數據,且關鍵信息采取明文存儲,給國家關鍵信息基礎設施安全和數據安全帶來嚴重安全風險隱患。近些年,隨著大數據、物聯網和人工智能等技術的不斷成熟,已經在公共管理和科學研究等多領域廣泛應用。通過數據分析能夠指導企業(yè)進行重要決策,協助國家制定未來的戰(zhàn)略發(fā)展方向等。
智能數字時代豐富人們工作與生活的同時,也將面臨諸多安全問題,例如數據的不安全存儲、數據的越權訪問和隱私泄漏等。近些年發(fā)生了多起數據泄漏事件,如MongoDB 數據庫被入侵、Facebook和SHEIN 數據庫泄露等,對公民的隱私造成極大的危害。數據安全治理已經成為當下人們關注的熱點。隱私計算在保證用戶數據安全的前提下,又能有效的解決“數據孤島”問題,成為數據安全保護的重要技術手段,引起了學術和工業(yè)界的廣泛關注。
相關法律法規(guī)
國內外數據泄露事件頻發(fā),大量企業(yè)的商業(yè)利益、聲譽受損。數據安全法律法規(guī)相繼頒布,監(jiān)管力度不斷升級,企業(yè)逐漸意識到數據安全治理的重要性與緊迫性。全球開展大規(guī)模的數據安全隱私保護法律法規(guī)的制定,如歐盟GDRP《通用數據保護條例》、加州CCPA《加利福尼亞州的消費者隱私法案》、加拿大PIPEDA《加利福尼亞州的消費者隱私法案》等。我國制定的主要法律和標準如表1所示,在全國人大發(fā)布的《數據安全法》、《網絡安全法》和《個人信息保護法》的三法聯動推進下,中國迎來了數據安全治理與隱私保護的合規(guī)發(fā)展階段。《數據安全法》明確提出數據的安全發(fā)展、數據安全制度、數據安全保護義務和政務數據安全與開放相關法律法規(guī);《網絡安全法》主要強調了個人用戶信息收集的安全合規(guī)、網絡數據的完整性、可用性和機密性;《個人信息保護法》強調個人信息在數據流通過程中的安全合規(guī)性,確立了個人信息的“最小必要”原則。國務院也發(fā)布了多項方案和意見,明確提出了對數據安全流通的建議與規(guī)劃。
《數據安全法》全文:http://www.npc.gov.cn/npc/c30834/202106/7c9af12f51334a73b56d7938f99a788a.shtml
《網絡安全法》全文:http://www.sprd.gov.cn/newsShow.asp?dataID=635
《個人信息保護法》全文:http://www.npc.gov.cn/npc/c30834/202108/a8c4e3672c74491a80b53a172bb753fe.shtml
表1 數據安全合規(guī)流通的法律法規(guī)及相關政策
數據安全
數據安全就是保障采集、傳輸和存儲、處理、共享和銷毀各階段的安全。每個階段都面臨著不同的風險,如采集階段面臨數據源不可靠風險、存儲階段面臨數據泄露的風險、處理階段面臨隱私數據挖掘的風險等,數據安全的主要任務在于識別這些風險,并采取適當的防范措施進行安全保障。目前企業(yè)主要將各種安全防護技術應用到數據中臺以此來保障數據安全,安全公司將各種技術集成在一起形成安全產品,如加密網關和智能分類分級、脫敏系統(tǒng),客戶可直接部署安全產品來解決安全防護問題。雖然目前出現了很多的安全產品,但是針對整個數據始終沒有統(tǒng)一的安全防護解決方案,風險處置和隱私保護等主要問題的解決方案尚未得到全面的探討。數據安全仍然是歷久常新的問題,安全防護策略需要不斷調整來應對當下復雜多變的環(huán)境,如何在技術革新的時代提出更加安全的防護模型,仍然是當下和未來大數據安全領域的重要命題。
隱私計算
互聯網技術的迅速發(fā)展,激發(fā)了數據要素流通的市場空間。傳統(tǒng)數據流通的方式無法滿足數據安全的要求,需要通過創(chuàng)新的技術來實現數據流通的安全性。隱私計算在保證數據提供方不泄露原始數據的前提下,對數據進行分析計算,數據以“可用不可見的”的方式進行安全流通,能有效的解決“數據孤島”問題,成為數據安全保護的重要技術手段。同時隱私計算中的多方安全計算技術還可以控制數據的用途以及用量,做到數據的“用途可控可計量”。在應用實踐中,隱私計算還可以融合區(qū)塊鏈技術來強化在“身份認證、訪問控制、計算和監(jiān)管”等方面的信任機制,如圖展示了基于隱私計算的數據可信流通。
圖1 基于隱私計算的數據可信流通
隱私計算的三種技術實現思路:以密碼學為核心、融合隱私保護技術的聯合建模、可信執(zhí)行環(huán)境。以密碼學為核心:主要包括多方安全計算,同態(tài)加密,差分隱私,零知識證明等多種密碼學技術 。目前行業(yè)的技術廠商通常將多方安全計算作為主要的技術方案,同態(tài)加密等密碼學算法也被較多的應用于業(yè)務實踐當中,或是與聯邦學習、可信執(zhí)行環(huán)境等技術方案開展融合應用。融合隱私保護技術的聯合建模:技術上采取聯邦學習與各類隱私保護技術相融合的技術實現方式,聯邦學習根據參與訓練客戶端的數據集特征信息不同,分為橫向聯邦學習、縱向聯邦學習和聯邦遷移學習??尚艌?zhí)行環(huán)境:采取對隱私數據的計算環(huán)境進行隔離和度量,數據和算法被加密輸入可執(zhí)行環(huán)境,對外只輸出最終的計算結果,原始數據和過程數據使用完就地銷毀,從而實現數據的“可用不可見”。
隱私計算包含如下三種關鍵計算方案:多方安全計算(MPC)、可信聯邦計算(TFL)和可信執(zhí)行環(huán)境(TEE)
1 多方安全計算(MPC)
多方安全計算于1986 年由姚期智院士通過姚氏百萬富翁問題提出。兩個百萬富翁街頭邂逅,他們都想炫富,比一比誰更有錢,但是出于隱私,都不想讓對方知道自己到底擁有多少財富,如何在不借助第三方的情況下,讓他們知道誰更有錢。姚氏“百萬富翁問題”后經發(fā)展,成為現代密碼學中非?;钴S的研究領域,即多方安全計算。MPC可以保障多個參與方進行協同計算并輸出計算結果,使各個參與方除了計算結果之外無法獲取任何其他信息,從技術層面實現數據的可用不可見,聯合挖掘數據價值,拓寬數據的使用維度。如圖2所示,多方安全計算技術是由一系列技術組成,按層次可分為專用算法層和支撐技術層。
圖2 多方安全計算(MPC)技術框架
專用算法:解決特定問題所構造出的特殊MPC協議,由于是針對性構造并進行優(yōu)化,專用算法的效率會比基于混淆電路(GC ,Garbled Circuit)的通用框架高很多,包含四則運算、比較運算、矩陣運算、隱私集合求交集、隱私數據查詢和差分隱私等。
支撐技術層:提供構建MPC的基礎技術實現,包含常用的加密解密、hash函數、密鑰交換、同態(tài)加密(HE,Homomorphic Encryption)、偽隨機函數等,還包含MPC中的基礎工具:秘密分享(SS,Secret Sharing)、不經意傳輸協議(OT,Oblivious Transfer)、不經意為隨機函數(OPRF,Oblivious Pseudorandom Function)等。
2 可信聯邦學習(TFL)
聯邦學習(FL)由Google于2016年提出,旨在構建一個基于分布數據集的聯邦學習模型,使得在原始數據不出庫的情況下,協同完成機器學習任務的學習模式,排除利用模型參數/梯度重構原始數據的潛在風險。任何多方聯合機器學習建模,都不可避免聯邦學習這一機器學習范式,基于FL可以量化分析隱私計算各種技術保護方案的優(yōu)劣,從而指導隱私計算算法的設計。合理運用包括多方安全計算(MPC)、可信執(zhí)行環(huán)境(TEE)、同態(tài)加密(HE)和差分隱私(DP)等技術進行融合,結合分布式機器學習和人工智能算法,找到聯合建??尚拧⒖尚泻涂煽氐慕鉀Q方案,實踐中FL將融合各類隱私保護技術,這就是“可信聯邦學習”的核心概念,不斷提高聯邦學習的能力,協同解決“數據孤島”和“數據隱私計算”的問題。
3 可信執(zhí)行環(huán)境(TEE)
TEE通過可信、抗篡改的軟硬件構建一個可信的安全環(huán)境,在硬件中為敏感數據單獨分配一塊隔離的內存,所有敏感數據均在這塊內存中展開計算,并且除了經過授權的接口外,硬件中的其他部分不能訪問這塊隔離內存中的信息。如圖3所示,展示了普通執(zhí)行環(huán)境和可信執(zhí)行環(huán)境的對比,數據在可信環(huán)境中由可信程序進行處理,以此來保護程序代碼或數據不被操作系統(tǒng)、其他應用程序竊取或篡改。
圖3 普通執(zhí)行環(huán)境和可信執(zhí)行環(huán)境對比
普通應用采取調用底層API可實現對上層業(yè)務的實現。對于操作系統(tǒng)支持的安全應用,硬件會開辟出可信執(zhí)行域,通過TEE函數API調用底層的用戶API,完成可信計算。
總 結
本次對滴滴公司的處罰作為一個典型案例,體現了國家對于加強網絡安全、數據安全、個人信息保護的重視程度和保護力度,對于重要數據處理有關企業(yè)應當全面梳理其相關業(yè)務、建立完善數據安全體系,做到依法合規(guī)運營。在數據面臨“隱私泄露”和“數據孤島“大背景下,本文通過分析相關的隱私泄漏事件以及在《網絡安全法》《數據安全法》《個人信息保護法》三法驅動下我國隱私保護技術的發(fā)展。本文就如何有效保障數據安全與隱私出發(fā),為讀者介紹了數據安全和隱私保護的相關概念,隱私計算能有效的保障數據安全,同時解決數據孤島問題,作為數據安全保護的重要技術手段,本文重點梳理隱私計算的實現思路和相關的技術方案,包括多方安全計算、可信聯邦學習和可信執(zhí)行環(huán)境,為未來隱私保護工作提供參考。
參考文獻
[1] Xiao, Z., & Xiao, Y. (2012). Security and privacy in cloud computing. IEEE communications surveys & tutorials, 15(2), 843-859.
[2] Wang, T., Mei, Y., Jia, W., Zheng, X., Wang, G., & Xie, M. (2020). Edge-based differential privacy computing for sensor–cloud systems. Journal of Parallel and Distributed computing, 136, 75-85.
[3] F. Deng-Guo, Z. Min, L. Hao, Big Data Security and Privacy Protection, Chinese Journal of
Computers, 37 (2014), 246–258.
[4] Goldreich, O. (1998). Secure multi-party computation. Manuscript. Preliminary version, 78, 110.
[5] Mo, F., Haddadi, H., Katevas, K., Marin, E., Perino, D., & Kourtellis, N. (2021, June). PPFL: privacy-preserving federated learning with trusted execution environments. In Proceedings of the 19th Annual International Conference on Mobile Systems, Applications, and Services (pp. 94-108).
[6] Fan Tingyu & Yuan Ke. (2021). Current Status and Trends of Big Data Security Research (2010- 2019)-Visual Analysis Based on CiteSpace. Software Guide (05), 243-248.
[7] Sabt, M., Achemlal, M., & Bouabdallah, A. (2015, August). Trusted execution environment: what it is, and what it is not. In 2015 IEEE Trustcom/BigDataSE/ISPA (Vol. 1, pp. 57-64). IEEE.
[8] https://www.iresearch.com.cn/Detail/report?id=3958&isfree=0
[9] https://zhuanlan.zhihu.com/p/384759946