本篇文章3367字,讀完約8分鐘
ketqua net s? k?t qu?【科技在線】在韓國圍棋界,獲得多項世界冠軍的職業(yè)九段李世石在與谷歌電腦alphago的人機大戰(zhàn)中,3連敗后,白手起家挽回一局。
大眾把這場圍棋人機大戰(zhàn)看得太重了,看成是人腦和計算機的徹底競爭,其實不然。 因為,進行比賽就像下圍棋一樣。 如果人類在圍棋人機大戰(zhàn)中輸了,人類的大腦也并不會比不上計算機。
事實上,圍棋變化多端,紛繁復(fù)雜,但理論上并不是無限的。 只不過可以看成是數(shù)學(xué)主題,用計算機編程運算得到答案。 在假時間里,人類在國際象棋這方面遲早很難與計算機匹敵。 即使李世石3連敗后,挽回了2局,那又如何呢? 在圍棋方面,人類遲早比不上人工智能。
圍棋人工智能的第一代算法采用窮舉法,計算所有的棋步,選擇必勝的棋步。 但是圍棋的一些變化太多了,一時半會兒不會。
第二代算法是在抽樣判斷中選擇勝率高的算法,大幅削減運算量,使得人工智能終于能夠與業(yè)余圍棋選手競爭。
Googlealphago是第三代算法,利用人工智能的自我學(xué)習(xí)能力飛躍性地提高了自己的象棋實力。 看起來輾壓世界職業(yè)高手的阿爾法·戈在第四局中遭到了冷遇,有什么問題呢?
阿爾法go的算法有問題。 第三代算法的問題實際上也是第二代算法的問題。 因為第三代算法基于第二代算法的采樣判斷進行自我學(xué)習(xí)。 即使alpha go能和自己下國際象棋提高棋藝水平,它也能這樣下國際象棋是基于抽樣判斷的。
抽樣判斷有弱點。 勝率高的下法未必是正確的下法,只不過是統(tǒng)計。 有些冷門的方法,反而可能會贏得驚人的勝利。
阿爾法go下臭棋時,思考速度特別快恰恰證明了此時樣本很少。 李世石78手是奇招,下這一手的棋手很少,阿爾法go按照程序運算后認(rèn)為李世石的勝算不高,反應(yīng)特別快。 這是個大錯誤。
在圍棋程序下象棋的棋手,感覺在計算機處于劣勢時的應(yīng)對非?;靵y。 不僅是阿爾法go,zen也是。 電腦處于勝率低的狀況,已經(jīng)很難考慮了。 根據(jù)樣本統(tǒng)計,在勝率低的情況下當(dāng)然輸贏多,逆轉(zhuǎn)取勝的樣本很難找。 勝率越低的情況下,alpha go的想法越混亂。 極端的情況下,找到的樣本中勝率低的一方已經(jīng)認(rèn)輸,可能沒有之后的棋譜。 我不擅長阿爾法戈該怎么辦。
阿爾法GO的失敗也是人類的失敗,畢竟程序也是人類編的。 另一方面,由于算法基于人類樣本,導(dǎo)致了alpha go的失敗。 如果李世石手上有對應(yīng)的樣本,alphago也不會這樣評價錯誤。
alpha go的父親哈比斯說:“alpha go的訓(xùn)練并不是特別要和李世石比較,而是讓普通棋手像比賽前一樣,只做日常的準(zhǔn)備。 阿爾法go準(zhǔn)備就是從網(wǎng)上下載很多業(yè)余棋手的棋譜研究,沒有什么特別之處。 之后,和某棋手進行比較準(zhǔn)備也不容易,我們至少需要幾百萬到幾億的棋譜,只有整體提供給alpha go,才能接收它進行深度學(xué)習(xí)。
哈比斯的話也證實了圍棋人工智能第二代第三代的死穴,也就是樣本判斷的問題。 李世石逆轉(zhuǎn)取勝的奇招,能找到的樣本很少。 阿爾法go顯然有很多職業(yè)棋手的質(zhì)量很高,需要參考非常全面的對局,這是行不通的。
圍棋難題還得處理
第四局,李世石交手反而能贏,這很不可思議。 因為奧賽羅有先手的特點,勝率很高。
人機大戰(zhàn)引出了長期困擾圍棋界的問題。 是圍棋規(guī)則中關(guān)于貼目的的規(guī)定。 不下圍棋的人可能不知道,但圍棋迷很清楚。 國際象棋棋手是先手,有其特點,所以為了公平起見,黑棋棋手需要盯著白棋棋。
1949年(昭和24年)日本棋院圍棋規(guī)則規(guī)定,黑方貼4目半。 從1955年第三期王座戰(zhàn)開始,黑棋貼目從4目半變更為5目半。 但據(jù)統(tǒng)計,黑方仍占特點。 截止到2001年底,在日本棋院近5年進行的1.5萬局官方公開對局中,(黑膠5目半的情況下)黑膠勝率達到51.86% )。 雖然黑白勝率差別不大,但在激烈的圍棋比賽中,這種差別是致命的。
在國際比賽中實力明顯優(yōu)異的韓國,在很多比賽中都轉(zhuǎn)入了第6輪半制。 中國也從2002年春天開始,全部改貼3/3/4子(相當(dāng)于7目半)。 日本棋院對50年來實行的黑白棋5目半的制度也進行了改革,使一部分比賽接近中韓,從2003年開始使用了所有黑白棋6目半的規(guī)則。
截止到年底,中國大陸主辦的第3局和第3/4局(相當(dāng)于7局半)世界錦標(biāo)賽共有380局對局,其中小黑贏了200局,勝率為52.6% ( )前3局春蘭杯相當(dāng)于5局半,未計入)。 另一方面,在臺灣舉行的應(yīng)氏杯( 8點貼,相當(dāng)于7目半)為黑勝100局、白勝97局。 據(jù)此,即使貼上7目半,黑色似乎也有點特色。
那么,到底黑側(cè)對白側(cè)盯上多少才是公平的呢? 現(xiàn)在,這個數(shù)值是根據(jù)很多人的對局統(tǒng)計計算出來的,在數(shù)學(xué)上并不是完美的答案。
說不定是阿爾法go讓金庸武俠小說的周伯通和郭靖左右勢均力敵,用左手和右手下棋,根據(jù)大量內(nèi)戰(zhàn)結(jié)果統(tǒng)計了粘貼目的的合理數(shù)值? o,這也不是完美的解答。
如前所述,alpha go之所以能自己下棋,還是根據(jù)與人類對局的抽樣來判斷的。 這和直接統(tǒng)計人類對局沒有區(qū)別。
完美的解答,還是要回到開頭,用原始的窮舉法,找到下圍棋的優(yōu)秀解。 這樣,就可以徹底確定粘貼目的的數(shù)值。 只是,運算量這么大的工程,不知道什么時候才能實現(xiàn)。
想象一下圍棋被徹底解讀后的樣子。 某國際圍棋大賽開始引起全世界的關(guān)注,手持黑手的棋手獲得了第一個孩子。 裁判馬上宣布,手持白手的棋手不必再干了。 比賽結(jié)果已經(jīng)確定,很明顯是誰贏了還是打成平局。 觀眾發(fā)出了歡呼聲。
阿爾法go打麻將是如何兼具桌游設(shè)計的隨機性的?
雖然圍棋人機大戰(zhàn)人類輸了,但一些網(wǎng)民表示,人類的智慧中還保護著中國麻將。 (詳情請參閱鈦媒體的文案“贏了圍棋也沒什么大不了的。 阿爾法狗敢挑戰(zhàn)麻將嗎? |是鈦做的)。 但是,中搜網(wǎng)絡(luò)創(chuàng)始人、北京圍棋業(yè)余比賽陳沛對采訪他的記者說:“如果是麻將,人類會輸?shù)酶鼞K吧! 麻將一共那么多,很容易計算。
但是陳沛的話其實是錯的。 如果有一棵傻大樹,他麻將打得不怎么樣,但是他運氣好,快要爆炸了,一開局就自己摸13嗎? 阿爾法go有破解度高的招數(shù)嗎?
麻將之類的棋牌游戲是隨機抽牌的,所以有運氣的因素。
一位網(wǎng)友對戲言說,如果麻將時三人聯(lián)手對付阿爾法go,阿爾法go會輸?shù)煤軕K。 這是作弊,但也有大問題。 多人游戲中,局面非常多且復(fù)雜,人工智能該如何應(yīng)對呢?
例如,3只身體在和alpha go打麻將,沒有人作弊,但是甲玩家技術(shù)不行,錯了牌,乙玩家受益。 這是阿爾法go無法控制的。
本來,alpha go學(xué)習(xí)麻將也必須根據(jù)與眾多人類對局的樣本來判斷。 阿爾法go只知道什么樣的打法勝率高,但是麻將沒有必勝的打法。
圍棋棋子擺在棋盤上是有目共睹的。 你聽說過倒扣將棋棋子玩的黑暗將棋嗎? 陸戰(zhàn)隊員也有暗手的游戲。 麻將實際上也類似于國際象棋的游戲。 卡片加蓋玩。 建造的棋牌是什么,還得推測。 阿爾法go最多通過計算來判斷,被覆蓋的棋牌是什么的可能性很高,無法通過正確的推論得到結(jié)果。 也就是說,阿爾法go只有永遠獲勝才能進化。
圍棋沒有運氣的要素,麻將有運氣的要素,哪一個都有吸引力。
從廣義上說,圍棋、麻將這些棋牌游戲,其實屬于桌游的范疇。 圍棋英語是go,阿爾法GO GO就是從那里來的。 圍棋進入bgg桌游排行榜前100名,中國國際象棋卡牌類游戲排名很高。
在民間,象棋和圍棋這種沒有運氣要素的棋牌(桌游)正在沒落。 現(xiàn)在關(guān)注圍棋人機大戰(zhàn)的網(wǎng)民是圍棋迷嗎?
因為大眾想要的是更娛樂的。 像象棋和圍棋這樣沒有運氣因素的,游戲水平比較穩(wěn)定。 他是名人。 普通人不容易贏。 除非你能找到象棋力量正好和你水平差不多的東西,否則玩起來沒意思。 強的東西太強了,太弱了。
因此,新興桌游的設(shè)計宗旨必須保證隨機性,具有運氣因素。 像萬智牌、游戲王、爐石傳說那樣隨機抽牌,像國際象棋和大富翁一樣擲骰子,都會產(chǎn)生隨機數(shù),帶來運氣成分。 如果有運氣的要素,所有玩家發(fā)揮的水平就不會太大不同,可以聚在一起開心地玩。
另一方面,沒有運氣因素的棋牌(桌游),理論上一定會存在優(yōu)秀的解,所以一旦出現(xiàn)優(yōu)秀的解,一定會引起興趣。 圍棋變化太多,至今也沒有優(yōu)秀的解,所以一直活到了今天。 現(xiàn)在,阿爾法go并沒有完全打敗李世石,圍棋的生命力看起來還很頑強。
標(biāo)題:“AlphaGo首出Bug,圍棋算法的死穴在哪兒?”
地址:http://www.kungfu-fish.com//xwdt/40276.html