成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

AlphaGo首出Bug,圍棋算法的死穴在哪

移動開發 算法
圍棋因為變化委實太多,至今仍未有最優解,所以能存活到今天。AlphaGo并沒有徹底擊敗李世石,看起來圍棋的生命力仍然很頑強

[[163852]]

再可怕的怪物也是有弱點的,AlphaGo為什么會下臭棋讓大家大跌眼鏡,圍棋人工智能第二代第三代的死穴是什么?

圍棋人工智能第三代的死穴在哪兒?

韓國圍棋界曾獲得多項世界冠軍的職業九段李世石對陣谷歌計算機AlphaGo的人機大戰,三連敗之后,執白棋居然扳回一局。

大眾把此場圍棋人機大戰看得太重,看作人腦跟電腦的徹底較量,其實不然,因為比試的只是圍棋一樣東西。圍棋人機大戰人類若輸了,不等于人腦就從此比不上電腦了。

實際上,圍棋雖然變化復雜,但理論上并非變化無窮。畢竟可以看作一道數學題目,可以用計算機來編程運算從而得到解答。假以時日,人類在下棋這一方面遲早難以與電腦匹敵。就算李世石三連敗之后能扳回兩局,那就怎么樣呢?下圍棋這一方面人類遲早是敵不過人工智能的。

圍棋人工智能第一代算法使用的就是窮舉法,試圖把所有的下法都算出來,然后選擇必勝的下法。但是因為圍棋的變化委實太多,暫時無法辦到。

第二代算法,是抽樣評估選擇勝率最高的算法,大大減省了運算量,使人工智能終于能跟業余圍棋選手較量。

谷歌AlphaGo是第三代算法,利用人工智能自我學習的能力使己身棋力突飛猛進。看上去似乎已能輾壓世界頂尖職業高手的AlphaGo,第四局居然爆冷下臭棋落敗,是出了什么問題?

Alpha Go的算法是有問題的。第三代算法的問題實際上也是第二代算法的問題,因為第三代算法是基于第二代算法的抽樣評估再加以自我學習。就算Alpha Go可以自己跟自己下棋提升棋力,它之所以能這樣下棋還是基于抽樣評估。

抽樣評估是有弱點的。勝率高的下法不一定就是正確的下法,畢竟這只是統計。有些冷門下法,也許反而能出奇制勝。

Alpha Go下臭棋時思考速度特別快恰恰說明此時的樣本少。李世石78手是奇招,會下這一手的棋手很少,AlphaGo按照程序運算的結果自以為李世石勝算不高,特別快地作出了反應。這是一個天大的錯誤。

跟圍棋程序下過棋的棋手都有這么一種感覺:電腦在劣勢時應對特別混亂。不單AlphaGo,Zen也是這樣。因為電腦處于勝率低的情況已經不好思考了。按照樣本統計,處于勝率低的情況下當然是落敗的多,反敗為勝的樣本可不好找。勝率越低的情況,AlphaGo的思路越混亂。在極端情況下,也許找到的樣本中勝率低的一方已經投子認輸了,沒有后續的棋譜,AlphaGo于是不懂該怎么辦了。

Alpha Go的失敗也是人類的失敗,畢竟的程序也是人類編出來的。另一方面,也是因為算法基于人類的樣本,導致了AlphaGo的失敗。如果有應對李世石那一招的樣本,AlphaGo也不至于如此判斷出錯。

Alpha Go之父哈薩比斯說:“AlphaGo的訓練并沒有專門針對李世石先生,而是像對普通棋手比賽前一樣,做的只是日常的準備。AlphaGo備戰就是從網上下載很多業余棋手的棋譜研究,沒有什么特別之處。”隨后又說,“要針對某一個棋手備戰也很難,我們至少需要數百萬甚至上億的棋譜,才能整體提供給AlphaGo,它才能接收并進行深度學習。”

哈薩比斯的話也證實了圍棋人工智能第二代第三代的死穴,也就是樣本評估的問題。像李世石反敗為勝這樣的奇招,能找到的樣本實在太少。AlphaGo明顯需要有大量職業棋手的優質且非常全面的對局作為參考,這可不好辦到。

圍棋貼目難題仍待解決

第四局,李世石執白棋反而能獲勝,這是一件很匪夷所思的事。因為黑棋有先手優勢,勝率更高。

圍棋人機大戰引出了一個長期困擾圍棋界的問題,就是圍棋規則中關于貼目的規定。不玩圍棋的人可能不知道,但圍棋迷都清楚。執黑棋的棋手是先手,享有優勢,故為了公平起見,黑方需要向白方貼目。

1949年(昭和24年)日本棋院圍棋規則規定:黑方貼4目半。從1955年的第3期王座戰起,黑棋貼目從4目半改為5目半。但是根據統計,黑方仍然占了優勢。截止到2001年底,在日本棋院近5年來進行的1.5萬盤正式公開棋賽對局中,(黑貼5目半的情況下)黑棋勝率達到了51.86%。執黑執白的勝率之差雖然不大,但在爭奪激烈的圍棋大賽上,這樣的差距足以致命。

在國際棋賽中實力明顯占優的韓國率先在大多數棋賽中改用6目半制。中國也從2002年春天起,全部改貼3又3/4子(相當于7目半)。日本棋院對于實行了50年的黑棋貼5目半的制度也實行了改革,將部分比賽向中韓靠攏, 2003年開始全部采用黑棋貼6目半規則。

截止到2014年底,中國大陸主辦的貼3又3/4子(相當于7目半)的世界大賽共有380盤對局,其中黑勝200局,勝率為52.6%(前3屆春蘭杯相當于貼5目半,未計入)。而臺灣舉辦的應氏杯(貼8點,也相當于7目半)則是黑勝100局,白勝97局。由此可見,即便是貼7目半,黑方似乎還是略占優勢。

那么,到底黑方要向白方貼目多少才絕對公平?目前這個數值只是根據大量人類對局作統計得出的,并非數學上的完美無懈的解答。

也許,讓AlphaGo學金庸武俠小說中的周伯通和郭靖左右互搏,自己左手跟右手下棋,然后通過大量內戰結果統計出貼目的合理數值?No,這也不是完美的解答。

前面說過,AlphaGo之所以能自己跟自己下棋,還是基于對人類對局的抽樣評估。這跟直接對人類對局進行統計沒什么兩樣。

完美的解答,還是要回到最初,用最原始的窮舉法,找出下圍棋的最優解。這樣,才能徹底制訂貼目的數值。只是不知道,運算量這么大的工程,不知道要到什么時候才能實現?

我們倒是可以設想一下圍棋得到徹底破解之后的情景:某國際圍棋大賽在萬眾矚目下開始了,執黑棋的棋手才下了第一子,裁判當即宣布,執白棋的棋手不用下了,比賽結果已定,誰勝誰負或是打成平手已經水落石出。觀眾一片歡呼。

AlphaGo玩麻將怎么樣兼論桌游設計的隨機性

圍棋人機大戰人類雖然輸了,但有些網友表示,人類的智慧還有中國麻將守著(詳見鈦媒體文章《贏了圍棋冠軍不算什么,阿爾法狗敢不敢挑戰麻將?|鈦搞了》)。但中搜網絡創始人、北京圍棋業余賽冠軍陳沛對采訪他的記者說:“要是麻將,人類會輸得更慘!麻將一共就那么多張,很容易算出來的。”

然而,陳沛的話其實是錯的。假設有個傻大木,他都不太會玩麻將,但他就是運氣好到爆棚,一開局就自摸十三幺,請問AlphaGo可有破解高招?

麻將這類棋牌游戲因為隨機抽牌,是有運氣成分的。

有網友就戲言:假如打麻將時三個人聯手對付AlphaGo,AlphaGo會輸得很慘。這雖然是作弊了,但也道出了一個大問題:在多人游戲中,局面變得異常復雜,人工智能要如何才能應對?

比如說,三個人跟Alpha Go打麻將,雖然沒人作弊,但是甲玩家技術不行打錯了牌導致乙玩家得利,這是Alpha Go所無法控制的。

說起來,AlphaGo要學習打麻將,也是得基于對大量人類對局的樣本評估。Alpha Go只能弄明白什么樣的打法勝率較高,然而打麻將并沒有所謂必勝的打法。

圍棋的棋子擺在棋盤上是明眼可見的。不知大家有沒有聽說過一種“暗棋”,就是將象棋的棋子反過來蓋上再玩的。陸戰棋也有暗棋的玩法。麻將其實也跟暗棋玩法類似,牌是蓋起來玩的。蓋起來的棋牌是什么,還得猜測。Alpha Go頂多是通過計算進行評估,蓋起來的棋牌是什么的可能性比較大,不可能準確推理得到唯一結果。也就是說Alpha Go永遠無法進化到100%獲勝的地步。

圍棋沒有運氣成分,而麻將有著運氣成分,兩者都有自己的魅力。

廣義上,圍棋、麻將這些棋牌游戲,其實是屬于桌游的范疇。圍棋的英文是“Go”,AlphaGo的“Go”就從此而來。圍棋躋身BGG桌游排行榜前100名,是中國棋牌類游戲排名最高的。

在民間,實際上像象棋、圍棋這類沒有運氣成分的棋牌(桌游)已漸趨沒落。現在關注圍棋人機大戰的網友,又有多少人是圍棋迷呢?

因為大眾想要的更是娛樂,像象棋、圍棋這類沒有運氣成分的,玩起來水平發揮比較穩定,高手就是高手,一般人很難贏得了,除非你能找到棋力剛巧跟你一個水平檔次的,不然玩起來沒意思,強的太強弱的過弱。

故此,新興桌游的設計宗旨,都是要保證隨機性,要有運氣成分。像萬智牌、游戲王和爐石傳說之類隨機抽牌,飛行棋、大富翁之類擲骰子,都是產生隨機數,帶來運氣成分。有了運氣成分,所有玩家發揮出來的水平就不至于相差太遠,能湊到一起玩個痛快。

另一方面,沒有運氣成分的棋牌(桌游),因為理論上一定存在最優解,最優解一旦出來后,肯定讓人興致大減。圍棋就是因為變化委實太多,至今仍未有最優解,所以能存活到今天。現在,AlphaGo并沒有徹底擊敗李世石,看起來圍棋的生命力仍然很頑強。

責任編輯:倪明 來源: 鈦媒體
相關推薦

2017-04-11 08:00:38

AlphaGoAI

2011-07-28 19:58:42

ERP軟件

2024-07-15 13:05:08

2017-01-13 08:37:57

PythonAlphaGoMuGo

2018-01-02 14:00:16

編程語言Bug

2016-04-12 20:43:54

AlphaGo+投資機器人因果樹

2019-11-29 08:00:36

AI 數據人工智能

2021-01-07 13:08:27

AI 數據人工智能

2017-03-22 11:34:42

人工智能柯潔

2011-04-29 10:05:57

主板硬盤

2012-03-19 20:29:02

iOS

2019-09-11 08:48:17

Windows 10WindowsBug

2009-09-21 15:15:34

2019-02-25 12:37:21

AI數據中心架構

2012-01-10 15:22:24

HTC專利

2016-12-02 08:51:05

AlphaGo大數據技術

2024-01-15 11:45:27

2017-09-20 13:52:26

新手大牛bug

2018-08-31 15:37:10

數據

2010-10-28 11:15:13

求職
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲三区视频 | 九九热在线免费视频 | 亚洲国产欧美国产综合一区 | 在线播放亚洲 | 国产在线97 | 亚洲国产精品视频一区 | 福利av在线 | 91久久看片 | 欧美日韩亚洲视频 | 日韩欧美久久 | 久久成人精品视频 | 亚洲视频三区 | 久久男人 | 免费三级网 | 久久一热| 日韩在线视频一区二区三区 | 综合在线视频 | 日韩欧美二区 | 一级毛片中国 | 在线观看成人精品 | 欧美一区二区三区在线看 | 偷拍亚洲色图 | 国产一级视频在线 | 亚洲第一在线 | 一区二区三区四区五区在线视频 | 国产一伦一伦一伦 | 成人国产a| 99精品视频免费观看 | 欧美乱码精品一区二区三区 | 免费日韩av | 欧美一级大片免费看 | 中文字幕一区二区三区在线观看 | 91免费小视频 | 九九亚洲精品 | 成人黄色电影在线播放 | 91在线精品一区二区 | 免费观看av | 综合精品| 午夜电影网站 | 美女黄频| 欧美日韩亚洲一区 |