AlphaGo之父:關(guān)于圍棋,人類3000年來(lái)犯了一個(gè)錯(cuò)
- 來(lái)源:互聯(lián)網(wǎng)
- 作者:NT
- 編輯:newtype2001
6、神秘棋手Master究竟是不是阿爾法狗?
那么我們今天的主題是“超越人類認(rèn)知的極限”,下一步應(yīng)該是什么呢?從去年三月以來(lái),我們一直在不斷完善和改進(jìn)阿爾法狗,大家肯定會(huì)問(wèn),既然我們已經(jīng)是世界冠軍了,還有什么可完善的?其實(shí),我們認(rèn)為阿爾法狗還不是完美的,還需要做更多的研究。
首先,我們想要繼續(xù)研究剛才提到的和李世石的第四局的比賽,來(lái)填充知識(shí)的空白;這個(gè)問(wèn)題其實(shí)已經(jīng)被解決了,我們建立了一個(gè)新的阿爾法狗分系統(tǒng),不同于主系統(tǒng),這個(gè)分支系統(tǒng)是用來(lái)困惑主系統(tǒng)的。我們也優(yōu)化了系統(tǒng)的行為,以前我們需要花至少3個(gè)月來(lái)訓(xùn)練系統(tǒng),現(xiàn)在只需要一周時(shí)間。
第二,我們需要理解阿爾法狗所采取的決定,并對(duì)其進(jìn)行解釋;阿爾法狗這樣做的原因是什么,是否符合人類的想法等等;我們通過(guò)對(duì)比人類大腦對(duì)于不同落子位置的反應(yīng)以及阿爾法狗對(duì)于棋子位置的反應(yīng),以期找到一些新的知識(shí);本質(zhì)上就是想讓系統(tǒng)更專業(yè)。我們?cè)诰W(wǎng)絡(luò)上與世界頂級(jí)的專家對(duì)決,一開始我們使用了一個(gè)假名(Master),在連勝之后被大家猜出是阿爾法狗。這些都是頂級(jí)的專家,我們至今已贏了60位大師了。如果你做個(gè)簡(jiǎn)單的貝葉斯分析,你會(huì)發(fā)現(xiàn)阿爾法狗贏不同對(duì)手的難易也不一樣。而且,阿爾法狗也在不斷自我創(chuàng)新,比如說(shuō)圖中右下角這個(gè)棋子(圓圈標(biāo)處),落在第二根線里,以往我們并不認(rèn)為這是個(gè)有效的位置。實(shí)際上,韓國(guó)有的團(tuán)隊(duì)預(yù)約了這些游戲,想研究其中新的意義和信息。
阿爾法狗自我創(chuàng)新,落在第二格線的旗子。
柯潔,既是中國(guó)的圍棋冠軍,也是目前的世界圍棋冠軍,他才19歲。他也在網(wǎng)上和阿爾法狗對(duì)決過(guò),比賽之后他說(shuō)人類已經(jīng)研究圍棋研究了幾千年了,然而人工智能卻告訴我們,我們甚至連其表皮都沒(méi)揭開。他也說(shuō)人類和人工智能的聯(lián)合將會(huì)開創(chuàng)一個(gè)新紀(jì)元,將共同發(fā)現(xiàn)圍棋的真諦。異曲同工,柯潔提到了圍棋的真理,我們?cè)谶@里談的是科學(xué)的真理。
紅遍網(wǎng)絡(luò)的神秘棋手Master2017年1月3日在騰訊圍棋對(duì)弈平臺(tái)贏了柯潔。
Master執(zhí)白中盤勝柯潔,Master就是AlphaGo的升級(jí)版。
那么圍棋的新紀(jì)元是否真的到來(lái)了呢?圍棋史上這樣的劃時(shí)代事件曾經(jīng)發(fā)生過(guò)兩次,第一次是發(fā)生在1600年左右的日本,20世紀(jì)30-40年代的日本,日本一位當(dāng)時(shí)非常杰出的圍棋高手吳清源提出了一個(gè)全新的關(guān)于圍棋的理論,將圍棋提升到了一個(gè)全新的境界。大家說(shuō)如今,阿爾法狗帶來(lái)的是圍棋界的第三次變革。
7、為什么人工智能“下圍棋”強(qiáng)于“下象棋”?
我想解釋一下,為什么人工智能在圍棋界所作出的貢獻(xiàn),要遠(yuǎn)大于象棋界。如果我們看看當(dāng)今的世界國(guó)際象棋冠軍芒努斯·卡爾森,他其實(shí)和之前的世界冠軍沒(méi)什么大的區(qū)別,他們都很優(yōu)秀,都很聰明。但為什么當(dāng)人工智能出現(xiàn)的時(shí)候,他們可以遠(yuǎn)遠(yuǎn)超越人類?我認(rèn)為其中的原因是,國(guó)際象棋更注重戰(zhàn)術(shù),而阿爾法狗更注重戰(zhàn)略。如今世界頂級(jí)的國(guó)際象棋程序再不會(huì)犯技術(shù)性的錯(cuò)誤,而在人類身上,不可能不犯錯(cuò)。
第二,國(guó)際象棋有著巨大的數(shù)據(jù)庫(kù),如果棋盤上少于9個(gè)棋子的時(shí)候,通過(guò)數(shù)學(xué)算法就可以計(jì)算出誰(shuí)勝誰(shuí)敗了。計(jì)算機(jī)通過(guò)成千上萬(wàn)的迭代算法,就可以計(jì)算出來(lái)了。因此,當(dāng)棋盤上少于九個(gè)棋子的時(shí)候,下象棋時(shí)人類是沒(méi)有辦法獲勝的。
因此,國(guó)際象棋的算法已經(jīng)近乎極致,我們沒(méi)有辦法再去提高它。然而圍棋里的阿爾法狗,在不斷創(chuàng)造新的想法,這些全新的想法,在和真人對(duì)決的時(shí)候,頂級(jí)的棋手也可以把其納入到考慮的范疇,不斷提高自己。
就如歐洲圍棋冠軍樊麾(第一位與阿爾法狗對(duì)陣的人類職業(yè)棋手)所說(shuō)的那樣,在和阿爾法狗對(duì)決的過(guò)程中,機(jī)器人不斷創(chuàng)新的下法,也讓人類不斷跳出自己的思維局限,不斷提高自己。大家都知道,經(jīng)過(guò)專業(yè)圍棋學(xué)校里30多年的磨練,他們的很多思維已經(jīng)固化,機(jī)器人的創(chuàng)新想法能為其帶來(lái)意想不到的靈感。我真的相信如果人類和機(jī)器人結(jié)合在一起,能創(chuàng)造出許多不可思議的事情。我們的天性和真正的潛力會(huì)被真正釋放出來(lái)。
8、阿爾法狗不為了贏取比賽又是為了什么?
就像是天文學(xué)家利用哈勃望遠(yuǎn)鏡觀察宇宙一樣,利用阿爾法狗,圍棋專家可以去探索他們的未知世界,探索圍棋世界的奧秘。我們發(fā)明阿爾法狗,并不是為了贏取圍棋比賽,我們是想為測(cè)試我們自己的人工智能算法搭建一個(gè)有效的平臺(tái),我們的最終目的是把這些算法應(yīng)用到真實(shí)的世界中,為社會(huì)所服務(wù)。
當(dāng)今世界面臨的一個(gè)巨大挑戰(zhàn)就是過(guò)量的信息和復(fù)雜的系統(tǒng),我們?cè)趺床拍苷业狡渲械囊?guī)律和結(jié)構(gòu),從疾病到氣候,我們需要解決不同領(lǐng)域的問(wèn)題。這些領(lǐng)域十分復(fù)雜,對(duì)于這些問(wèn)題,即使是最聰明的人類也無(wú)法解決的。
我認(rèn)為人工智能是解決這些問(wèn)題的一個(gè)潛在方式。在如今這個(gè)充斥著各種新技術(shù)的時(shí)代,人工智能必須在人類道德基準(zhǔn)范圍內(nèi)被開發(fā)和利用。本來(lái),技術(shù)是中性的,但是我們使用它的目的和使用它的范圍,大大決定了其功能和性質(zhì),這必須是一個(gè)讓人人受益的技術(shù)才行。
我自己的理想是通過(guò)自己的努力,讓人工智能科學(xué)家或者人工智能助理和醫(yī)藥助理成為可能,通過(guò)該技術(shù),我們可以真正加速技術(shù)的更新和進(jìn)步。
(本文作者系英國(guó)劍橋大學(xué)神經(jīng)學(xué)博士生,AlphaGo之父哈薩比斯在劍橋大學(xué)的校友)

玩家點(diǎn)評(píng) (0人參與,0條評(píng)論)
熱門評(píng)論
全部評(píng)論