成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

擊敗申真谞陪練的圍棋AI,卻輸給了業余人類棋手

人工智能
由于KataGo對勝利過于自信——認為如果游戲結束并計算分數自己就會贏——所以KataGo會主動pass,然后攻擊者也pass,從而結束游戲,開始計分。

一個連業余棋手都打不過的新模型,竟然擊敗了世界最強圍棋AI——KataGo?

沒錯,這驚掉人下巴的結果來自MIT、UC伯克利等的最新論文。

研究人員利用對抗攻擊方法,抓住了KataGo的盲點,并基于該技術使一個菜鳥級圍棋程序成功打敗了KataGO。

在沒有搜索的情況下,這一勝率甚至達到了99%。

這么算下來,圍棋界的食物鏈瞬間變成了:業余棋手>新AI>頂級圍棋AI?

等等,這個神奇的新AI是怎么做到又菜又厲害的?

刁鉆的攻擊角度

在介紹新AI之前,讓我們先來了解一下這次被攻擊的主角——KataGo。

KataGo,目前最強大的開源圍棋AI,由哈佛AI研究員開發。

此前,KataGo戰勝了超人類水平的ELF OpenGo和Leela Zero,即使沒有搜索引擎的情況下,其水平也與歐洲前100名圍棋專業選手相當。

剛剛拿下三星杯冠軍、實現“三年四冠”的韓國圍棋“第一人”申真谞,就一直用的KataGo進行陪練。

圖片

△圖源:Hangame

面對實力如此強勁的對手,研究人員選擇的方法可以說是四兩撥千斤了。

他們發現,盡管KataGo通過與自己進行數百萬次游戲來學習圍棋,但這仍然不足以涵蓋所有可能的情況。

于是,這次他們不再選擇自我博弈,而是選擇對抗攻擊方法:

讓攻擊者(adversary)和固定受害者(victim,也就是KataGo)之間進行博弈,利用這種方式訓練攻擊者。

這一步改變讓他們僅用訓練KataGo時0.3%的數據,訓練出了一個端到端的對抗策略(adversarial policy)。

具體來說,該對抗策略并不是完全在做博弈,而是通過欺騙KataGo在對攻擊者有利的位置落子,以過早地結束游戲。

以下圖為例,控制著黑子的攻擊者主要在棋盤的右上角落子,把其他區域留給KataGo,并且還心機的在其他區域下了一些容易被清理的棋子。

論文共同一作Adam Gleave介紹:

這種做法會讓KataGo誤以為自己已經贏了,因為它的地盤(左下)比對手的要大得多。

但左下角的區域并沒有真正貢獻分數,因為那里仍留有黑子,這意味著它并不完全安全。

圖片

由于KataGo對勝利過于自信——認為如果游戲結束并計算分數自己就會贏——所以KataGo會主動pass,然后攻擊者也pass,從而結束游戲,開始計分。(雙方pass,棋就結束)

但正如Gleave分析的一樣,由于KataGo圍空中的黑子尚有活力,按照圍棋裁判規則并未被判定為“死子”,因此KataGo的圍空中有黑子的地方都不能被計算為有效目數。

因此最后的贏家并不是KataGo,而是攻擊者。

這一勝利并不是個例,在沒有搜索的情況下,該對抗策略對KataGo的攻擊達到了99%的勝率。

當KataGo使用足夠的搜索接近超人的水平時,他們的勝率達到了50%。

圖片

另外,盡管有這種巧妙的策略,但攻擊者模型本身的圍棋實力卻并不強:事實上,人類業余愛好者都可以輕松地擊敗它。

圖片

研究者表示,他們的研究目的是通過攻擊KataGo的一個意想不到的漏洞,證明即使高度成熟的AI系統也會存在嚴重的漏洞。

正如共同一作Gleave所說:

(這項研究)強調了對AI系統進行更好的自動化測試以發現最壞情況下的失敗模式的必要性,而不僅僅是測試一般情況下的性能。

研究團隊

該研究團隊來自MIT、UC伯克利等,論文共同一作為Tony Tong Wang和Adam Gleave。

圖片

Tony Tong Wang,麻省理工學院計算機科學專業博士生,有過在英偉達、Genesis Therapeutics等公司實習的經歷。

圖片

Adam Gleave,加州大學伯克利分校人工智能博士生,碩士和本科畢業于劍橋大學,主要研究方向是深度學習的魯棒性。

圖片

論文的鏈接附在最后,感興趣的小伙伴們可以自取~

論文鏈接:https://arxiv.org/abs/2211.00241

參考鏈接:https://arstechnica.com/information-technology/2022/11/new-go-playing-trick-defeats-world-class-go-ai-but-loses-to-human-amateurs/

責任編輯:武曉燕 來源: 量子位
相關推薦

2022-11-03 14:09:26

2023-02-20 09:39:32

2019-11-29 08:00:36

AI 數據人工智能

2022-04-02 10:18:04

AI棋牌程序

2018-08-31 15:37:10

數據

2019-11-18 10:34:24

戴爾

2023-07-13 15:10:06

2019-08-09 17:00:18

2018-10-20 15:20:10

2022-02-15 14:06:26

人工智能程序員圍棋

2025-02-27 09:26:58

2022-07-01 11:06:25

AI人工智能科技巨頭

2024-08-09 12:46:04

2025-06-23 15:19:11

AIChatGPT蘋果

2021-01-15 13:04:57

人工智能人工智能趨勢

2017-01-05 09:09:10

2016-03-10 19:53:13

2009-12-04 09:57:02

微軟Linux

2022-07-06 14:51:07

人工智能技術研究

2019-01-25 18:37:20

AI數據科技
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品一区二区av | 久草视频在线播放 | 亚洲一区二区三区免费观看 | 日本粉嫩一区二区三区视频 | 国产一级片免费在线观看 | 在线视频91 | 国产成人一区在线 | 色综网| 在线中文字幕亚洲 | 欧美日韩一 | 国产成人精品亚洲日本在线观看 | 性天堂网 | 一区二区不卡视频 | 国产精品夜夜夜一区二区三区尤 | 欧美精品一区三区 | 国产成人高清视频 | 超碰免费在 | 国产日韩久久久久69影院 | 羞羞免费网站 | 欧美视频在线看 | 中文字幕的av | 国产精品中文字幕在线 | 久久国产成人午夜av影院武则天 | 日韩高清一区 | 日韩视频一区在线观看 | 欧美精品在线一区二区三区 | 9久久精品 | 中文字幕在线免费视频 | 黄视频在线网站 | 久久精品一区 | 国产最好的av国产大片 | 国产一级片久久久 | 91在线视频免费观看 | 高清视频一区 | 国产毛片视频 | 国产一级片免费在线观看 | 黄网站在线播放 | 国产精品久久久久久久7777 | 91不卡| 午夜精品 | 欧美日韩一区二区三区在线观看 |