成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

人類竟能再度擊敗頂級圍棋AI?一招逆風翻盤,這個業余四段棋手完勝

人工智能 新聞
時隔7年,人類圍棋選手首次「大勝」頂尖AI棋手!是什么策略,讓李世石都甘拜下風的人工智能鎩羽而歸呢?

2016年,是人工智能的崛起之年。

自從AlphaGo完勝圍棋世界冠軍李世石之后,代表圍棋頂尖水平的玩家再也不是人類。

然而,今天金融時報的一篇文章讓圍棋重回人們的視野:人類找到了戰勝AI的方法!

圖片

蟄伏7年,人類棋手要卷土重來了嗎?

圍棋逆風翻盤,人類戰勝AI?

FT報道稱,來自美國的業余四段棋手Kellin Pelrine,一舉擊敗了頂級的下棋AI——KataGo。

在15場線下比賽中,Perline在沒有計算機的幫助下,贏得了14場比賽。

而這個讓人類棋手奪回圍棋桂冠的計劃,出自加州研究公司FAR AI的研究人員之手。該團隊通過分析AI棋手的弱點加以針對,從而獲得最后的勝利。

FAR AI的首席執行官Adam Gleave說:「對我們來說,利用這個系統非常容易。」

Gleave表示,團隊研發的AI在與KataGo進行了100多萬次的對局之后,發現了一個人類玩家可以利用的「bug」。

Pelrine說,他們發現的獲勝策略「對人類來說并不難」,中級玩家可以使用它來擊敗機器。他還使用這種方法戰勝了另一個頂級圍棋系統Leela Zero。

圖片

Kellin Pelrine

FT寫道,雖然有計算機的幫助,但這場決定性的勝利還是為人類棋手打開了一扇大門。

七年之前,人工智能在這項最復雜的游戲中遙遙領先于人類。

?由DeepMind設計的AlphaGo系統,在2016年以4比1擊敗了圍棋世界冠軍李世石。李世石也在慘敗三年后宣布退役,稱AlphaGo是「無法擊敗的」。

而對于人工智能的這種強勢,Pelrine不以為然。在他看來,棋局中大量的組合和變化,意味著計算機不可能評估棋手所有可能的未來招式。

簡單來說,Pelrine使用的策略是「聲東擊西」。

一方面,Pelrine在棋盤的各個角落落子,迷惑AI;另一方面,Pelrine認準AI棋手的一片領域,逐漸將其四周包圍。

圖片

Pelrine說,即使包圍即將完成,AI棋手也沒有注意到這一片區域的危險。他接著說:「但是作為人類,這些漏洞是很容易被發現的。」

加州大學伯克利分校計算機科學教授Stuart Russell說,一些最先進的圍棋游戲機被發現存在弱點,這表明支撐當今最先進AI的深度學習系統存在根本缺陷。

他表示,這些系統只能「理解」他們經歷過的特定情況,并且無法和人類一樣,對策略進行簡單的概括。

能戰勝AI的,只有AI!

不過嚴格意義上來說,研究人員是通過AI打敗了AI,或者說,用AI幫助人類在圍棋中擊敗AI。

作為參考來源的論文,首次發表于2022年11月并在今年1月進行了更新,作者則分別來自于MIT、UC伯克利等機構。

文中,研究人員訓練出了一個具有抗性策略的AI,進而擊敗了最先進的圍棋人工智能系統KataGo。

圖片

項目地址:https://goattack.far.ai/adversarial-policy-katago#contents

論文地址:https://arxiv.org/abs/2211.00241

結果顯示,當KataGo不使用搜索樹時,攻擊者在1000盤棋中取得了100%的勝率,而當KataGo使用足夠多的搜索時,勝率超過97%。

對此,研究人員強調,對抗性策略AI可以擊敗KataGo,但它卻會被人類業余愛好者戰勝,與此同時人類業余愛好者是打不贏KataGo的。

也就是說,這個AI能夠取勝,并不是因為圍棋下得更好,而是它能誘使KataGo去犯下嚴重的錯誤。

圖片

攻擊策略

在此之前,像是KataGo和AlphaZero等等這些下棋AI,都通過自我博弈進行訓練的。

但在這項被作者稱為「受害者游戲」(victim-play)的研究中,攻擊者(adversary)需要通過與一個固定的受害者(victim)進行博弈,來訓練自己的制勝策略(不是模仿對手的下法)。

對此,研究人員引入了兩個不同的對抗性MCTS(A-MCTS)策略來解決這個問題。

  • 樣本A-MCTS-S:研究人員設置的搜索過程為:當受害者下棋時,從受害者的策略網絡中采樣;當輪到攻擊者時,從攻擊者的策略網絡中采樣。
  • 遞歸A-MCTS-R:由于A-MCTS-S低估了受害者的實力,因此研究人員提出了一種新的策略A-MCTS-R。然而,這種變化增加了攻擊者訓練和推理的計算復雜性。

具體來說,在A-MCTS-R中,研究人員會在受害者節點上使用一個新的(遞歸)MCTS搜索來進行模擬,從而取代A-MCTS-S中的受害者采樣步驟。

雖然這不再是一個完美的受害者模型,但它往往比A-MCTS-S更準確,因為后者會錯誤地假設受害者不進行搜索。

圖片

評估結果如下,具體細節可參閱原文。

圖片

責任編輯:張燕妮 來源: 新智元
相關推薦

2022-11-10 13:57:48

2022-11-03 14:09:26

2018-07-18 17:58:00

2020-06-10 10:32:10

人工智能技術編輯

2019-11-29 08:00:36

AI 數據人工智能

2011-02-24 17:52:22

Watsonibm

2022-02-15 14:06:26

人工智能程序員圍棋

2021-01-10 08:21:43

Chrome瀏覽器系統技巧

2025-03-13 08:01:32

2016-12-02 20:10:22

人工智能唇語序列

2019-01-28 05:48:15

5G無線網絡運營商

2022-02-13 07:48:57

工具macOS蘋果

2013-07-30 11:24:33

SAP“簡化IT 一招

2017-01-05 09:09:10

2024-05-09 12:18:00

AI醫院

2021-09-14 07:10:34

人工智能AI深度學習

2021-11-22 11:30:37

JavaScript代碼瀏覽器

2009-03-23 19:23:20

四核服務器AMD

2018-08-31 15:37:10

數據

2019-08-09 17:00:18

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美成人a∨高清免费观看 91伊人 | 成人精品一区二区三区四区 | h视频在线播放 | 亚洲国产区 | 久久夜视频 | 亚洲国产aⅴ精品一区二区 免费观看av | 亚洲精品黄色 | 精品福利在线 | 青青久在线视频 | 久久久久久免费免费 | 国产午夜精品一区二区三区四区 | 中文字幕在线观看精品 | 91国内视频在线 | 一级欧美一级日韩片免费观看 | 中文字幕蜜臀 | 美女天天操 | 黄视频国产 | 在线观看黄色电影 | 久久成人免费视频 | 国产一区二区三区久久久久久久久 | 久久久五月天 | 久久视频一区 | 日韩av啪啪网站大全免费观看 | 99这里只有精品视频 | 成人在线看片 | www.av在线| 午夜精品久久久久久久久久久久久 | 午夜国产精品视频 | 国产一区二区在线视频 | 香蕉视频一区二区 | 老司机久久 | 久久国产精品网 | 亚洲国产精品一区二区三区 | 国产精品毛片 | 91在线精品视频 | 中文字幕一区二区三区乱码图片 | 亚洲欧美激情国产综合久久久 | 户外露出一区二区三区 | 日韩欧美二区 | 精品亚洲一区二区三区 | 国产一区91精品张津瑜 |