AlphaGo之父:關(guān)于圍棋,人類3000年來(lái)犯了一個(gè)錯(cuò)
- 來(lái)源:互聯(lián)網(wǎng)
- 作者:NT
- 編輯:newtype2001
4、棋局哪個(gè)關(guān)鍵區(qū)域被人類忽視了?
這對(duì)于我們來(lái)說(shuō)也是一生僅有一次的偶然事件。這場(chǎng)比賽,全世界28億人在關(guān)注,35000多篇關(guān)于此的報(bào)道。整個(gè)韓國(guó)那一周都在圍繞這個(gè)話題。真是一件非常美妙的事情。對(duì)于我們而言,重要的不是阿爾法狗贏了這個(gè)比賽,而是了解分析他是如何贏的,這個(gè)系統(tǒng)有多強(qiáng)的創(chuàng)新能力。阿爾法狗不僅僅只是模仿其他人類選手的下法,他在不斷創(chuàng)新。在這里舉個(gè)例子,這是第二局里的一個(gè)情況,第37步,這一步是我整個(gè)比賽中最喜歡的一步。在這里,黑棋代表阿爾法狗,他將棋子落在了圖中三角標(biāo)出的位置。為什么這步這么關(guān)鍵呢?為什么大家都被震驚到了。
圖左:第二局里,第37步,黑棋的落子位置 圖右:之前貌似陷入困境的兩個(gè)棋子。
其實(shí)在圍棋中有兩條至關(guān)重要的分界線,從右數(shù)第三根線。如果在第三根線上移動(dòng)棋子,意味著你將占領(lǐng)這個(gè)線右邊的領(lǐng)域。而如果是在第四根線上落子,意味著你想向棋盤中部進(jìn)軍,潛在的,未來(lái)你會(huì)占棋盤上其他部分的領(lǐng)域,可能和你在第三根線上得到的領(lǐng)域相當(dāng)。
所以在過去的3000多年里,人們認(rèn)為在第三根線上落子和第四根線上落子有著相同的重要性。但是在這場(chǎng)游戲中,大家看到在這第37步中,阿爾法狗落子在了第五條線,進(jìn)軍棋局的中部區(qū)域。與第四根線相比,這根線離中部區(qū)域更近。這可能意味著,在幾千年里,人們低估了棋局中部區(qū)域的重要性。
有趣的是,圍棋就是一門藝術(shù),是一種客觀的藝術(shù)。我們坐在這里的每一個(gè)人,都可能因?yàn)樾那楹脡漠a(chǎn)生成千上百種的新想法,但并不意味著每一種想法都是好的。而阿爾法狗卻是客觀的,他的目標(biāo)就是贏得游戲。
5、阿爾法狗拿下李世石靠哪幾個(gè)絕招?
大家看到在當(dāng)前的棋局下,左下角那兩個(gè)用三角標(biāo)出的棋子看起來(lái)好像陷入了困難,而15步之后,這兩個(gè)棋子的力量擴(kuò)散到了棋局中心,一直延續(xù)到棋盤的右邊,使得這第37步恰恰落在這里,成為一個(gè)獲勝的決定性因素。在這一步上阿爾法狗非常具有創(chuàng)新性。我本人是一個(gè)很業(yè)余的棋手,讓我們看看一位世界級(jí)專家MichaelRedmond對(duì)這一步的評(píng)價(jià)。Michael是一位9段選手(圍棋最高段),就像是功夫中的黑段一樣,他說(shuō):“這是非常令人震驚的一步,就像是一個(gè)錯(cuò)誤的決定。”在實(shí)際模擬中,Michael其實(shí)一開始把棋子放在了另外一個(gè)地方,根本沒想到阿爾法狗會(huì)走這一步。像這樣的創(chuàng)新,在這個(gè)比賽中,阿爾法狗還有許多。在這里,我特別感謝李世石先生,其實(shí)在我們贏了前三局的時(shí)候,他下去了。
2016年3月阿爾法狗大戰(zhàn)世界圍棋冠軍李世石,以4:1的總分戰(zhàn)勝了人類。
那是三場(chǎng)非常艱難的比賽,尤其是第一場(chǎng)。因?yàn)槲覀冃枰粩嘤?xùn)練我們的算法,阿爾法狗之前打贏了歐洲冠軍,經(jīng)過這場(chǎng)比賽,我們知道了歐洲冠軍和世界冠軍的差別。理論上來(lái)講,我們的系統(tǒng)也進(jìn)步了。但是當(dāng)你訓(xùn)練這個(gè)系統(tǒng)的時(shí)候,我們不知道有多少是過度擬合的,因此,在第一局比賽結(jié)束之前,系統(tǒng)是不知道自己的統(tǒng)計(jì)結(jié)果的。所以,其實(shí)第一局,我們非常緊張,因?yàn)槿绻谝痪州斄?,很有可能我們的算法存在巨大漏洞,有可能?huì)連輸五局。但是如果我們第一局贏了,證明我們的加權(quán)系統(tǒng)是對(duì)的。
不過,李世石先生在第四場(chǎng)的時(shí)候,回來(lái)了,也許壓力緩解了許多,他做出了一步非常創(chuàng)新性的舉動(dòng),我認(rèn)為這是歷史上的創(chuàng)新之舉。這一步迷惑了阿爾法狗,使他的決策樹進(jìn)行了錯(cuò)誤估計(jì),一些中國(guó)的專家甚至稱之為“黃金之舉”。通過這個(gè)例子,我們可以看到多少的哲理蘊(yùn)含于圍棋中。這些頂級(jí)專家,用盡必生的精力,去找出這種黃金之舉。其實(shí),在這步里,阿爾法狗知道這是非常不尋常的一步,他當(dāng)時(shí)估計(jì)李世石通過這步贏的可能性是0.007%,阿爾法狗之前沒有見過這樣的落子方式,在那2分鐘里,他需要重新搜索決策計(jì)算。我剛剛已經(jīng)提到過這個(gè)游戲的影響:28億人觀看,35000相關(guān)文章的媒體報(bào)道,在西方網(wǎng)售的圍棋被一搶而空,我聽說(shuō)MIT(美國(guó)麻省理工學(xué)院)還有其他很多高校,許多人新加入了圍棋社。
第四局里,李世石第78步的創(chuàng)新之舉。
我剛才談到了直覺和創(chuàng)新,直覺是一種含蓄的表達(dá),它是基于人類的經(jīng)歷和本能的一種思維形式,不需要精確計(jì)算。這一決策的準(zhǔn)確性可以通過行為進(jìn)行評(píng)判。在圍棋里很簡(jiǎn)單,我們給系統(tǒng)輸入棋子的位置,來(lái)評(píng)估其重要性。阿爾法狗就是在模擬人類這種直覺行為。創(chuàng)新,我認(rèn)為就是在已有知識(shí)和經(jīng)驗(yàn)的基礎(chǔ)上,產(chǎn)生一種原始的,創(chuàng)新的觀點(diǎn)。阿爾法狗很明顯的示范了這兩種能力。


-
傾國(guó)之怒
-
原始傳奇
-
斗羅大陸(我唐三認(rèn)可0.1折)
-
太閣立志2
-
奇門(0.1折仙俠不用閃)
-
深淵契約
-
貓狩紀(jì)0.1折
-
靈劍仙師(斗破蒼穹)
玩家點(diǎn)評(píng) (0人參與,0條評(píng)論)
熱門評(píng)論
全部評(píng)論