AI應用如何兼顧數據安全?看百度MesaTEE與飛槳聯動
你知道整個人類社會,現階段每年會產生多少,或者說多大體量的數據么?
IDC發布的《數據時代2025》報告顯示,全球每年產生的數據將從2018年的33ZB增長到175ZB(1ZB約等于1萬億GB)??[1]???,意味著它將會是可觀測宇宙中星星數量的160倍。以25Mb/秒的網速,一個人要下載完這175ZB的數據,需要18億年。
圖1 數據來源:IDC
資料來源:數據時代 2025,贊助商:希捷,數據來自 IDC 全球數據圈,2018 年 11 月
人們對數據的重視程度與日俱增,可以說,誰能掌握和合理運用大數據的核心資源,誰就能在接下來的技術變革中進一步發展壯大。特別是在人工智能開始賦能千行百業的當下,豐富的數據可以幫助顯著提升AI模型的精度,讓企業從容面對業務發展和創新的需求,幫助企業進一步實現增效。但是在各行各業進行數據收集和利用的同時,數據泄露、數據濫用等安全事件頻發,為個人隱私、企業商業秘密、國家重要數據等帶來了嚴重的安全隱患。
數據可以造福人類,前提是保障安全
數據安全問題是與我們每個人息息相關的,例如在公有云和區塊鏈上,醫療健康和財務記錄等敏感數據可能會被惡意程序窺探,造成隱私泄露;在數據交互時,不同類別的機密信息可能被中斷、攔截,落入惡意使用者之手;機器學習模型或者安防模型一旦泄露,攻擊者還可盜用知識產權或利用模型漏洞進行攻擊,導致無法挽回的后果。
因此,國內外各大知名軟件廠商、硬件廠商以及芯片公司亟需發展基于硬件安全和軟件安全的全方位服務框架。意在創建一種可信的執行環境,用安全可信賴的機制來保障數據安全,在受到攻擊時最大程度確保隱私數據和計算模型不被泄漏或濫用,且同時提供功能、性能、兼容性和靈活性的支持。
英特爾與百度攜手共建點石MesaTEE安全計算平臺
?在全行業對數據安全的迫切需求下,百度MesaTEE安全計算平臺應運而生,其基于英特爾? 軟件防護擴展(Intel? Software Guard Extensions,英特爾? SGX)技術打造,可通過提供完整的“通用安全計算”方式,構建內存安全的可信計算平臺,幫助大數據和AI產業提供數據隱私和安全解決方案。MesaTEE在隱私保護的前提下,打破產業鏈上下游既有的數據壁壘,有效解決數據流通與協作過程中的合法合規、數據安全問題。通過硬件創建的可信執行環境,幫助敏感的程序代碼和關鍵數據得到芯片級的安全保障,確保其機密性和完整性,實現數據的“可用不可見”。
英特爾? SGX為MesaTEE提供基于硬件的解決方案,使MesaTEE得以完善機密深度計算能力,從而保護敏感數據。商業版MesaTEE為廠商客戶提供深度定制的商用解決方案,不僅支持基于英特爾? SGX的TEE計算引擎,而且獨創了協同機密計算引擎,讓大規模的隱私數據分析及訓練成為可能。作為一個通用的機密計算平臺,MesaTEE整體完全運行在TEE可信環境中,且完全使用Rust語言撰寫,能夠做到從數據上傳數據處理到結果獲取的全流程保護。此外,MesaTEE也是一個多方任務協作平臺,能通過任務方式(類似于合同方式)來管理合作流程,確保執行流程不受外界干擾。這意味著參與方能在隱私信息不泄露的前提下,公平地完成任務協作,達成共識后獲取到各自所需的計算結果或模型。
MesaTEE安全計算平臺通過私有化或云服務幫助金融、政務、互聯網等行業在聯合建模、聯合營銷、聯合風控等場景下一站式完成數據聯合計算,賦能企業機構合法合規的采集數據、存儲數據、挖掘數據。
圖2 百度MesaTEE整體架構
MesaTEE是基于英特爾? SGX打造的,英特爾? SGX的主要功能是可請求CPU在內存中分配出來一塊受CPU保護的區域,也叫“飛地”,“飛地”中受保護的代碼和數據不受操作系統或者VMM的影響,即便操作系統或BIOS這些底層的基礎軟件在黑客攻擊中淪陷,通過SGX技術生成的“飛地”也能更有效地阻斷這些攻擊,盡力避免其中的應用程序和數據被非法的復制或篡改。
2021年發布的面向單路和雙路服務器的第三代英特爾? 至強? 可擴展處理器,全產品線都對SGX技術實現了內置,且最多可在一個雙路服務器系統中支持高達1TB的“飛地”空間,單顆處理器最高支持512GB,為企業實現更大數據量的隱私計算打下基礎。目前,學術界和工業界已經對SGX技術展開了廣泛的研究,SGX可被用于構建可信的身份認證環境、可信的網絡通信通道、可信的系統審計、高效安全的密文計算機制、保護AI程序和云計算相關數據安全等方面。
英特爾? SGX為MesaTEE提供基于硬件的解決方案,其價值體現如下:
1. 安全:英特爾? SGX可以安全地將云用戶的數據和代碼執行隔離、加密,即使云計算環境里的操作系統、虛擬機管理器、或相鄰的其他虛擬機被攻擊或破壞,這些數據代碼的完整性和保密性都能得到保障;
2. 高效:英特爾? SGX支持MesaTEE為各類TEE平臺提供了統一的抽象API,開發者可以輕松地開發可遷移的TEE程序,且有大量實驗數據標明,引用SGX不會給系統內存及性能帶來壓力;
3. 靈活:英特爾? SGX還能與其他TEE平臺兼容,如TPM、MKTME、AMD SEV/SME、ARM TrustZone及FPGA等,MesaTEE提供了廣泛的運行環境支持,也能為不同安全等級需求的場景提供不同寬松度的硬件依賴要求。
MesaTEE與百度飛槳聯動,助深度學習兼顧效率與安全
MesaTEE在應用上,已經和主流云計算、區塊鏈、及研究機構深入合作,綜合推進硬件TEE、軟件內存安全、和應用豐富強大的計算服務。基于百度安全計算服務框架MesaTEE的百度飛槳(PaddlePaddle)深度學習平臺已為多個領域提供了機密計算的典型示例,打破了數據提供方、建模方與使用方之間的割裂及障礙,并且免除了軟件層面的密文操作,執行速度快且能對抗服務端的惡意攻擊。
圖3 基于英特爾? SGX的百度 MesaTEE 平臺與百度飛槳平臺聯動
借助硬件級的英特爾? SGX技術,百度PaddlePaddle得以更高速地實現在嵌入式TEE環境中的運行,搭載新一代英特爾? 至強? 可擴展處理器時的運行速度快。此外硬件級解決方案排除了網絡限制,避免了網絡故障導致大型訓練任務中斷的風險,實現了對性能與安全更好的兼顧,構建了更安全的AI生態。
SGX安全計算的更多可能性和潛力
SGX技術或者說TEE類技術的出現及演進,必將大大延展互聯網信任的技術邊界,基于此孵化出下一代區塊鏈基礎設施、高速多方的安全計算,將廣泛應用于大數據分析和機器學習中,以此推動新一輪商業模式變革。
對于企業和客戶來說,英特爾? SGX技術經過了百度等諸多客戶的探索并基于反饋進行調整,已經對于當前市場和業務具備較高的適配性,所以在未來也將會得到更多的實際部署。這不僅可以進一步放大企業的商業價值,更是為人工智能領域的發展提供源源不斷的技術助力和數據積累。
參考白皮書:https://www.intel.cn/content/www/cn/zh/customer-spotlight/cases/security-processor-level-sgx-electronic-patient.html
架構師成長計劃課程鏈接:https://bizwebcast.intel.cn/eventstart.aspx?eid=315&tc=u6s8lwaepl&frm=wechatkol