成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

PubDef:使用公共模型防御遷移攻擊

譯文
人工智能 機器學習
對抗性攻擊對機器學習模型構成了嚴重威脅。但是大多數提議的防御措施對于干凈數據的性能影響太大,因而不現實。

譯者 | 布加迪

審校 | 重樓

對抗性攻擊對機器學習系統的可靠性和安全性構成了嚴重威脅。通過對輸入進行微小的變動,攻擊者可以導致模型生成完全錯誤的輸出。防御攻擊是一個活躍的研究領域,但大多數提議的防御措施存在重大的缺點。

這篇來自加州大學伯克利分校研究人員的論文則介紹了一種名為PubDef的新防御方法,在這個問題上取得了一些進展。在保持干凈輸入準確性的同時,PubDef在面對現實攻擊時獲得了更高的穩健性。本文解釋了這項研究的背景PubDef工作原理、結果及其局限性。

對抗性威脅領域

人們研究了許多類型的對抗性攻擊最常見的是白盒攻擊。在這里,攻擊者可全面訪問模型的參數和架構。這讓他們得以計算梯度,以精確地設計導致錯誤分類的輸入。像對抗性訓練這樣的防御措施已經被提議,但它們在面對干凈輸入時性能會大大降低。

遷移攻擊更現實。攻擊者使用可訪問的代理模型來設計對抗性示例。他們希望這些遷移騙過受害者的模型遷移攻擊很容易執行,并且不需要訪問受害者模型。

基于查詢的攻擊對模型進行重復查詢以推斷其決策邊界。一些防御措施通過監視使用情況來檢測和限制這些攻擊。

總的來說,遷移攻擊在實踐中非常合理,但無法通過典型的防御措施來加以解決,比如對抗性訓練或限制查詢的系統。

博弈論觀點

圖1. 該論文的圖顯示了一個威脅模型,低成本攻擊者使用公共模型進行遷移攻擊還顯示了PubDef防御

PubDef專門旨在抵抗來自公開可用模型的遷移攻擊。作者將攻防之間的交互描述為一種游戲

  • 攻擊者的策略是選擇一個公共源模型和攻擊算法來設計對抗性示例。
  • 防御者的策略是為模型選擇參數使其具有穩健性。
  • 博弈論為最佳策略的推理提供了工具。重的是,防御者可以同時針對來自多個源模型的攻擊進行訓練。這種類似集成的方法使模型對各種攻擊具有穩健性。

PubDef工作原理

PubDef通過以下方式訓練模型

1. 選擇一組不同的公開可用源模型

2. 使用訓練損失最大限度地減少來自這些源模型的遷移攻擊的錯誤

這種對抗性訓練過程調整模型以抵抗公共源遷移過來的特定威脅模型。

訓練損失根據當前的錯誤率對每個攻擊動態加權。這側重于訓練最有效的攻擊。

源模型的選擇涵蓋不同的訓練方法標準、對抗性和破壞穩健性等。這提供了對未知攻擊的廣泛覆蓋。

試驗結果

論文作者在CIFAR-10、CIFAR-100和ImageNet數據集上針對264不同的遷移攻擊評估PubDef。

結果顯示,PubDef明顯優于之前的防御措施比如對抗性訓練

  • 在CIFAR-10上,PubDef達到了89%的準確率,而對抗性訓練達到了69%的準確性
  • 在CIFAR-100上,準確率為51%33%
  • 在ImageNet上,準確率為62%36%

值得注意的是,PubDef實現了這一改進,并且面對干凈輸入的準確性幾乎沒有下降

  • 在CIFAR-10上,準確率僅從96.3%下降到96.1%
  • 在CIFAR-100上,準確率從82%下降到76%
  • 在ImageNet上,準確率從80%下降到79%

圖2. PubDef實現了這一改進,面對干凈輸入的準確性幾乎沒有下降圖2. PubDef實現了這一改進,面對干凈輸入的準確性幾乎沒有下降

因此,與對抗性訓練相比,PubDef提供了更好的穩健性,對未擾動數據的性能影響要小得多。

局限性和未來工作

PubDef特別關注來自公共模型的遷移攻擊解決不了白盒攻擊等其他威脅。另外一些限制如下:

  • 依賴模型保密
  • 可以通過訓練一個私人代理模型來加以規避
  • 需要防御基于查詢的攻擊其他方法。

鑒于預期范圍,PubDef提供了與實際攻擊者能力相一致的實用防御。但還需要做進一步的工作,才能處理其他威脅,并減輕對保密的依賴。

總的來說,這項工作在可部署防御方面取得了重大進展。通過針對一個合理的威脅模型,穩健性的提高幾乎是免費的,精確度損耗最小。這些想法有望推動進一步的研究,從而產生更有效和實用的防御措施。

結論

對抗性攻擊為部署可靠的機器學習系統提出了一個緊迫的挑戰。雖然了許多防御措施,但很少有防御措施面對干凈輸入不降低性能的情況下在穩健性方面取得實質性進展。

PubDef代表著朝開發可以實際部署在實際系統中的防御邁出了有希望的一步。在處理其他類型的攻擊和模型保密減輕依賴程度方面仍有工作要做。然而,這里介紹的技術(即通過博弈論為模型建立交互、針對各種威脅進行訓練,以及關注可行的攻擊為進一步的進展提供了藍圖。

對抗性攻擊可能仍然是機器學習安全的一個問題。隨著模型不斷滲到醫療保健、金融和交通等關鍵領域,對有效防御的需求變得更加迫切。PubDef表明,如果力求防御與實際威脅相一致,可以無需兼顧取舍的情況下大幅提升穩健性。開發實用的防御措施,將額外成本降到最低,這是安全可靠地部署機器學習安全切實可行途徑。

原文標題:PubDef: Defending Against Transfer Attacks Using Public Models,作者:Mike Young

責任編輯:華軒 來源: 51CTO
相關推薦

2013-06-24 10:16:45

2014-08-21 10:46:57

2012-11-30 14:54:48

2009-11-10 14:12:20

2013-11-04 09:15:58

2010-09-08 12:35:51

2010-10-08 10:03:16

2012-02-14 09:43:08

2011-03-01 10:52:15

2017-05-08 14:33:51

2013-04-25 11:04:42

2011-01-18 15:29:46

2010-09-13 09:20:21

2021-06-03 10:16:12

CSRF攻擊SpringBoot

2009-10-29 17:47:31

2010-09-29 14:00:05

2010-07-19 21:52:35

2019-12-29 23:16:42

網絡攻擊惡意軟件網絡安全

2018-04-24 08:42:19

2010-09-30 15:20:01

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 精品九九九 | 国产一区二区自拍 | 国产女人叫床高潮大片免费 | 欧美在线a | 精品久久一区 | 日日操夜夜干 | 国产男女视频 | 91一区二区在线观看 | 午夜精品久久久久久久久久久久久 | 久久精品一区 | 成人在线视频一区 | 手机在线观看 | 亚洲另类视频 | 日韩高清www | 狠狠干av| 中文字幕 亚洲一区 | 国产精品一区二区视频 | 四虎伊人| 国产精品爱久久久久久久 | 亚洲精品一二区 | 日韩一区二区免费视频 | 98久久| 精品国产伦一区二区三区观看方式 | 亚洲精品视频在线播放 | 一区二区三区四区在线视频 | 天天久久 | 国产精品毛片一区二区三区 | 一区二区国产精品 | 人人看人人搞 | 成人在线免费观看 | 成人自拍视频网站 | 亚洲免费人成在线视频观看 | 国产午夜精品一区二区三区四区 | 五月综合激情在线 | 中文二区| 国产a区| 97国产精品视频人人做人人爱 | 久久一二区| 国产精品乱码一区二区三区 | 精品久久精品 | 日本电影免费完整观看 |