成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

AlphaZero黑箱終于被打開!登頂5年后,人類揭開它學會下棋的奧秘

人工智能
AlphaZero于2017年由DeepMind發布并一鳴驚人。這是一種神經網絡驅動的強化學習器,專精于棋類,內部包含了殘差網絡(ResNet)骨干網及分離的策略及價值heads。

AI如何學到知識的?科學家敲開了它的腦殼看了看。

這兩天,DeepMind及谷歌大腦一篇文章被《美國國家科學院院刊》(PNAS)收錄,其內容正是以5年前發布的AlphaZero為例,研究神經網絡如何獲取并理解國際象棋知識。

圖片

在內容中,研究者重點關注了「神經網絡是如何學習的」「知識又如何被量化表示」等問題。

有意思的是,他們發現:

在沒有人類對弈指導下,AlphaZero仍形成了一套類似專業棋手才懂的概念體系。研究者還進一步探尋了這些概念何時何處形成。

此外,他們還對比了AlphaZero與人類開局棋風的不同。

有網友感慨,這是個影響深遠的工作:

圖片

也有人感慨,AlphaZero能計算任何人類行為特征了?!

圖片

欲知更多觀察結果,往下看。

掀起了神經網絡的頭蓋骨

AlphaZero于2017年由DeepMind發布并一鳴驚人。

這是一種神經網絡驅動的強化學習器,專精于棋類,內部包含了殘差網絡(ResNet)骨干網及分離的策略及價值heads。

其輸出函數可表示如下,z為國際象棋排布情況:

圖片

為研究AlphaZero如何「學習」的,研究者構建了一個人類理解國際象棋的函數c(z0)。其中,z0為一個象棋特定排布概念,c(z0)以專業國際象棋引擎Stockfish 8評估分數作為參考。

再從AlphaZero角度,設一個廣義線性函數g(zd),作為在不同層取值的探針。訓練設定下,g(zd)將不斷趨近??(??0),研究者通過觀察g(zd)與??(??0)近似情況,以確認系統是否理解相關概念。

圖片

接著,研究團隊隨機抽取了10萬盤游戲作為訓練集,觀察AlphaZero表現。

情況如下圖,結果顯示,隨著訓練步數(step)及ResNet網絡塊數(block)越來越多,AlphaZero表現出來的分數越來越高(圖A),對弈過程中,每一步對敵方威脅性的也隨之增加(圖C)。

圖片

由于實驗中出現了異常值,研究者探討了其背后的潛在語義。

如下圖,少數紅色點位置遠離主流分布,殘差值也在紅虛線之上,說明人類對棋局判斷c函數與g函數有明顯差異。

研究團隊發現,這些值對應棋局中,人類判斷為白方有利,同時,黑方皇后都能在兌子(exchange)過程中被進一步吃掉。

研究者推斷認為,這是源于AlphaZero的Value Head與參考評價函數編碼方式與參考系統的不同。

圖片

此外,研究者還觀察了人類棋手及國際象棋編程所看重的重要參數,隨訓練過程的變化,其中包括:國王安全度(King Safety)、一方棋子總戰力(Material)、機動性(Mobility)、走棋威脅性(Threats)等。

結果顯示,它們在初始情況下幾乎為零,但隨著訓練不斷往下進行,以國王安全度(King Safety)、一方棋子總戰力(Material)為代表,部分參數在模型中的權重明顯上升。

這讓研究者相信,通過訓練過程,AlphaZero已經逐漸掌握了原本沒有教給它的相關重要概念或者說知識。

圖片

最后,研究者還著重看了看開局演變與下棋風格,發現AlphaZero隨時間推移,下棋路徑選擇范圍在縮小,而人類下棋偏好和路徑在變多。

科研人員表示,目前原因尚不清楚,但它反應了人與機器神經網絡之間的根本差異。

圖片

關于后續研究方向,作者提出,下一步希望能探索AI模型能否超越人類的認知概念范圍,去掌握學會新的東西。

團隊介紹

本文一作Thomas McGrath 來自DeepMind,博士畢業于倫敦帝國學院,主要研究領域包括ML、人工智能安全及可解釋性。

二作Andrei Kapishnikov,來自Google Brain,主攻人工智能應用領域,早前曾在VMware及Oracle從事技術工作。

圖片

值得一提的是,國際象棋大師Vladimir Kramnik也參與了該項目的研究。

參考鏈接:[1]?https://twitter.com/weballergy/status/1461281358324588544[2]?https://www.pnas.org/doi/10.1073/pnas.2206625119

責任編輯:武曉燕 來源: 量子位
相關推薦

2022-11-18 18:39:03

AI神經網絡

2023-02-24 15:56:24

AI象棋

2023-05-22 09:19:19

2012-02-08 10:26:50

筆記本評測

2012-08-24 09:23:00

Windows Log

2025-03-21 13:17:38

2009-12-03 09:19:41

Linux系統奧秘

2023-02-20 15:00:44

2015-08-18 15:14:47

2023-05-23 14:17:01

云原生百度知乎

2021-06-29 18:45:18

Windows 11微軟控制面板

2013-10-11 15:25:43

華為存儲華為

2012-07-02 16:55:48

4G

2019-06-06 15:33:59

GitHub微軟開發者

2012-12-18 09:16:21

IBM計算機感官

2020-08-31 11:10:57

編程語言PythonJava

2009-05-25 10:02:47

SanDisk摩爾定律失效

2013-05-21 14:45:42

BYOD網絡管理員工自帶設備

2019-10-30 10:42:42

CIO數字化轉型開發

2009-10-22 20:48:28

IT管理統一通信
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 西西裸体做爰视频 | 精品国产精品三级精品av网址 | 天天拍天天操 | 日韩在线不卡 | 欧美日韩国产免费 | 99视频在线 | 五月婷婷丁香 | 视频在线一区二区 | 欧美电影免费观看高清 | 视频在线亚洲 | 亚洲三级免费看 | 成人美女免费网站视频 | www.伊人.com | 日韩精品一区在线观看 | 亚洲欧美日本在线 | 国产日韩精品在线 | 国产综合视频 | 老司机精品福利视频 | 91 久久| 久久伊人亚洲 | 久久99精品久久久久 | 成人毛片网 | 欧美久久久网站 | 国产一区二区三区在线看 | 亚洲美女视频 | 天天色av | 久久久久亚洲 | 欧美一级片免费看 | 伊人久久精品一区二区三区 | 91成人免费看片 | 九九热精 | 国产精品一区二区在线免费观看 | 荷兰欧美一级毛片 | 99re视频这里只有精品 | 国产欧美日韩一区 | 狠狠影院 | 中文字幕在线视频网站 | 亚洲精品乱码久久久久久按摩观 | 天天躁天天操 | 久久99精品久久久久久国产越南 | 免费在线黄色av |