騰訊重點(diǎn)開(kāi)發(fā)游戲AI 未來(lái)和你打LOL的可能是AI
- 來(lái)源:36Kr
- 作者:skylark
- 編輯:豆角
未來(lái)和你LOL電競(jìng)的可能是騰訊的AI。
這個(gè)聽(tīng)起來(lái)有點(diǎn)腦洞大開(kāi)的想法,并非遙不可及。騰訊的AI Lab就正在這么做。
AI正成為大公司的必爭(zhēng)領(lǐng)域。相比于Google、微軟、IBM、百度、阿里等公司,騰訊在AI方面的宣傳并不多。事實(shí)上,2016年騰訊組建了30多人的AI Lab, 并在AI技術(shù)及應(yīng)用方面進(jìn)行研究。
相比于技術(shù)的研發(fā),我們更關(guān)心騰訊AI應(yīng)用方面的規(guī)劃。在今天騰訊研究院的年會(huì)上,騰訊集團(tuán)副總裁、騰訊人工智能實(shí)驗(yàn)室負(fù)責(zé)人姚星就詳細(xì)闡述了這一問(wèn)題。
技術(shù)方面,騰訊AI主要是基于四個(gè)垂直領(lǐng)域,分別會(huì)在CV(計(jì)算機(jī)視覺(jué))、ASR、語(yǔ)音識(shí)別、NLP(自然語(yǔ)言處理)。在計(jì)算機(jī)視覺(jué)領(lǐng)域,除了傳統(tǒng)的圖像處理,還會(huì)引入AR、空間定位等技術(shù)。在語(yǔ)音識(shí)別方向,除了傳統(tǒng)的語(yǔ)音識(shí)別、語(yǔ)音合成,還引入了自動(dòng)翻譯。在自然語(yǔ)言處理方面,除了傳統(tǒng)的自然語(yǔ)言處理,還會(huì)引入監(jiān)督類(lèi)的機(jī)器學(xué)、無(wú)監(jiān)督類(lèi)的增強(qiáng)學(xué)習(xí)。
在應(yīng)用層面,則主要會(huì)結(jié)合騰訊的業(yè)務(wù),主要分為內(nèi)容AI、社交AI、游戲AI。 內(nèi)容AI方面,主要是個(gè)性化的推薦。社交和游戲是騰訊最強(qiáng)的兩個(gè)業(yè)務(wù),也是騰訊AI最重要的兩個(gè)結(jié)合點(diǎn)。在社交AI方向,會(huì)面向于社交的能力去提供AI能力,未來(lái)有可能會(huì)推出聊天機(jī)器人、智能助手等。
與很多大公司不同,騰訊的AI將游戲作為了一個(gè)重要的方向。姚星設(shè)想,未來(lái)有一天,有一個(gè)AI可能會(huì)參加LOL這樣的競(jìng)賽,跟人對(duì)打;而將AI應(yīng)用在《王者榮耀》這樣的爆款游戲中,可玩性、樂(lè)趣性都有可能增加。
為了方便大家更多的了解騰訊AI Lab的一些信息,我們也對(duì)姚星的演講進(jìn)行了整理。
以下為姚星演講的整理
姚星:
各位朋友大家下午好。今天我演講的題目是AI真實(shí)的希望和隱憂。
什么叫希望,希望就說(shuō)明大家期待,隱憂說(shuō)明大家期望過(guò)大。
第一我首先要澄清一個(gè)事情,剛剛主持人馬斯特是不是騰訊做的,我要澄清,馬斯特不是騰訊。
我們回顧一下互聯(lián)網(wǎng)發(fā)展的二十年,實(shí)際上過(guò)去的二十年是信息高速發(fā)展的二十年,它經(jīng)過(guò)了幾個(gè)發(fā)展階段。從我們發(fā)展的方向上面來(lái)講,應(yīng)該是在九十年代初期,中國(guó)應(yīng)該第一次連上互聯(lián)網(wǎng),在上個(gè)世紀(jì)九十年代我們進(jìn)入到互聯(lián)網(wǎng)大家庭當(dāng)中了,但是由于當(dāng)時(shí)網(wǎng)絡(luò)數(shù)據(jù)連接的問(wèn)題,大部分在互聯(lián)網(wǎng)上的應(yīng)用還是只限于溝通,溝通解決了很多問(wèn)題,人不再需要面對(duì)面,或者通過(guò)傳統(tǒng)的書(shū)信的方式進(jìn)行溝通,人可以通過(guò)互聯(lián)網(wǎng),不論在天涯海角,只要能連上互聯(lián)網(wǎng),總是可以觸達(dá)到一些消息。隨著整個(gè)設(shè)備傳輸?shù)陌l(fā)展,網(wǎng)吧的興起,大家連接網(wǎng)絡(luò)的速度提升,你會(huì)發(fā)現(xiàn)我們的網(wǎng)絡(luò)帶寬提升速度越來(lái)越大,這時(shí)候人們對(duì)互聯(lián)網(wǎng)的訴求不再僅僅是通過(guò)消息的傳遞溝通,更多的是分享。MSN也好,包括FaceBook,包括QQ空間,都是基于分享,人人為我,我為人人,那時(shí)候有很多東西都是通過(guò)互聯(lián)網(wǎng)來(lái)分享喜悅和苦惱。
隨著后面移動(dòng)時(shí)代的發(fā)展,特別是智能手機(jī)的發(fā)展,智能終端的發(fā)展你會(huì)發(fā)現(xiàn),最后在最近這五年以來(lái),我們的移動(dòng)互聯(lián)網(wǎng)高速發(fā)展,人們不再是在指定的地點(diǎn)和指定的地方進(jìn)行互聯(lián)網(wǎng)連接,以前傳統(tǒng)大家都是在網(wǎng)吧或者工作的地方,現(xiàn)在大家通過(guò)手機(jī)無(wú)時(shí)無(wú)刻連到互聯(lián)網(wǎng),所以整個(gè)過(guò)往的二十年是隨著設(shè)備的發(fā)展,產(chǎn)業(yè)的發(fā)展,隨著信息產(chǎn)業(yè)的發(fā)展而演進(jìn)。伴隨著過(guò)往二十年發(fā)展,騰訊二十年我們做了什么呢?實(shí)際上我們?cè)诿恳粋€(gè)時(shí)代都有騰訊一款重量級(jí)的產(chǎn)品。在最早的溝通時(shí)代,在上世紀(jì)九十年代的時(shí)候,我們有QQ,QQ目前是世界上在線最大的容量,已經(jīng)達(dá)到同時(shí)兩億人在線,在2000年初的時(shí)候,我們有了我們的QQ空間,QQ空間目前的日上傳的照片數(shù)是超過(guò)五億張,這個(gè)規(guī)模如果我們跟世界上最大的網(wǎng)站FaceBook去比,是差不多同一個(gè)量級(jí)。2013年FaceBook日上傳照片數(shù)大概在2.5億左右,目前QQ空間日上傳照片數(shù)也好,總照片數(shù)也好跟FaceBook是同一個(gè)量級(jí)。
然后在移動(dòng)互聯(lián)網(wǎng)時(shí)代,毫無(wú)疑問(wèn)騰訊,大家現(xiàn)在都知道的一個(gè)產(chǎn)品就是微信,這款產(chǎn)品不光是簡(jiǎn)單的,還是玩超級(jí)的人,它不僅是解決了溝通問(wèn)題,還解決了社交、分享的問(wèn)題,還是一款包括我們?nèi)ゾ€下支付,線下的打車(chē),甚至醫(yī)院掛號(hào)看病,交水電費(fèi)等等一系列使用都在那一個(gè)軟件上面,實(shí)際上這三款騰訊產(chǎn)品在世界上來(lái)講都是領(lǐng)先的。整個(gè)發(fā)展史我們也看出過(guò)往的發(fā)展史是從信息時(shí)代,我們說(shuō)從窄帶到寬帶,到移動(dòng)互聯(lián)網(wǎng)時(shí)代,它猶如生物進(jìn)化一樣,從早期的單細(xì)胞到多細(xì)胞到最后的智能。今年來(lái)講實(shí)際上這個(gè)智能會(huì)更加的廣義了,不僅僅是智能終端,大家更多的討論的,今天的智能是AI。
去年2016年又是整個(gè)AI真正發(fā)展六十周年,所以在去年AI在世界上也爆發(fā)起來(lái)。包括我剛剛在小房間跟很多嘉賓在聊的時(shí)候,說(shuō)騰訊是一個(gè)很低調(diào)的,的確很低調(diào),很多人問(wèn)我騰訊有沒(méi)有做AI?怎么從來(lái)沒(méi)有向外宣傳呢?實(shí)際上騰訊有自己的AI相關(guān)的部門(mén),從2016年4月份開(kāi)始,騰訊成立了自己的部門(mén),目前我們的情況就是,基本上有30多個(gè)科學(xué)家,90%以上的人都是博士學(xué)歷以上,絕大多數(shù)人都是海外回來(lái),然后從他們?cè)盒?lái)講,都是從世界最頂級(jí)的學(xué)府引進(jìn)的人才,包括哈佛,康奈爾,麻省理工等等,哥倫比亞大學(xué)等等這些學(xué)校。
所以目前在騰訊里面,我們已經(jīng)組織了一個(gè)AI團(tuán)隊(duì),但是這個(gè)規(guī)模還在擴(kuò)張。騰訊的AI可能不像其它公司的AI讓人那么了解,比如說(shuō)像谷歌的AI,大家很多了解在做圍棋,包括他們出來(lái)很多的產(chǎn)品,包括他們的語(yǔ)音等等的很多東西,包括像百度,他們有無(wú)人車(chē),有度蜜等等的一些產(chǎn)品,包括FaceBook等等,所以它做了很多圖像上面的東西,等等等等,但騰訊的AI一直沒(méi)有對(duì)外宣傳,今天我也跟大家分享一下,騰訊在AI上面的考慮。實(shí)際上騰訊的AI我們主要是基于四個(gè)垂直領(lǐng)域,分別會(huì)在CV(計(jì)算機(jī)視覺(jué)),還會(huì)在ASR,語(yǔ)音識(shí)別,就是語(yǔ)音識(shí)別上面,我們還會(huì)有一個(gè)專屬的垂直領(lǐng)域,另外在LP,自然語(yǔ)言處理上面也會(huì)有,每一個(gè)領(lǐng)域里面也會(huì)拓展到更多深層次的研究。比如我們?cè)谟?jì)算機(jī)視覺(jué)領(lǐng)域,我們可能除了傳統(tǒng)的圖像處理,還會(huì)引入AR的東西,增強(qiáng)現(xiàn)實(shí)的東西在里面,也會(huì)引入空間定位的技術(shù)在里面。語(yǔ)音識(shí)別我們除了傳統(tǒng)的語(yǔ)音識(shí)別,語(yǔ)音合成,還會(huì)引入更多的這種,跟語(yǔ)音相關(guān)的,就是我們的自動(dòng)翻譯方面的一些,放在里面,另外除了傳統(tǒng)的自然語(yǔ)言處理的這種人的認(rèn)知行為的一些研究,我們還會(huì)做,比如說(shuō)對(duì)話的聊天機(jī)器人這類(lèi)的一些研究放在這里面,在新領(lǐng)域,就是我們監(jiān)督類(lèi)的機(jī)器學(xué)習(xí),到增強(qiáng)學(xué)習(xí),我們都會(huì)在四個(gè)領(lǐng)域。所以這四個(gè)領(lǐng)域基本上涵蓋了當(dāng)今整個(gè)AI基礎(chǔ)研究領(lǐng)域的方方面面,這是四個(gè)基礎(chǔ)的研究領(lǐng)域。
然后我們另外提出了四個(gè)專屬的這種產(chǎn)品研究方向,這是結(jié)合了我們整個(gè)騰訊公司來(lái)進(jìn)行的,我們提出了有內(nèi)容的AI,我們把搜索引擎基于個(gè)性化的推薦,基于內(nèi)容類(lèi)的東西和搜索類(lèi)的。另外我們還有我們的社交,騰訊是一個(gè)傳統(tǒng),就是一個(gè)非常,在社交平臺(tái)上面非常厲害的公司,包括我們剛剛說(shuō)的QQ空間,它都是一個(gè)社交平臺(tái),所以在社交AI上面我們會(huì)面向于社交的能力去提供AI能力,就是剛剛我說(shuō)的對(duì)話,包括聊天機(jī)器人,包括我們智能助手,都會(huì)在這個(gè)方向上去研究。
另外一個(gè)方向,我覺(jué)得是跟全世界其他所有的公司不太一樣的一個(gè)AI方向,大家可能會(huì)問(wèn)我,也有做圍棋的AI,但是它只是一個(gè)簡(jiǎn)單的圍棋,它不會(huì)有太多的游戲,但對(duì)于騰訊來(lái)講,在整個(gè)騰訊集團(tuán)里面有個(gè)很大的產(chǎn)業(yè)是游戲,我們會(huì)在游戲里面引入更多AI能力,實(shí)際上想像空間是非常大的,大家試想一下,LOL是不是可以有一天,會(huì)有個(gè)AI可以參加這種世界競(jìng)賽,跟人對(duì)打,大家也知道今天騰訊有一款很受歡迎的手游叫做王者榮耀,如果把這里面的能力提升,是不是可玩性,樂(lè)趣性就會(huì)更多,對(duì)于騰訊來(lái)說(shuō)這一塊也是很關(guān)注的。除此之外我們還會(huì)提供我們很多工具類(lèi)的AI,這里面就會(huì)提供我們這種能力把它開(kāi)放出來(lái),包括基于圖像上人臉識(shí)別的能力,包括語(yǔ)音識(shí)別的能力,包括在自然語(yǔ)言處理的能力等等等等,包括我們?cè)趯W(xué)習(xí)平臺(tái)的能力。所以說(shuō)整個(gè)騰訊從目前來(lái)講,我們的研究AI基礎(chǔ)領(lǐng)域是四個(gè),然后我們的方向也是四個(gè)。
剛剛講了很多前面的篇章,是講騰訊,包括新產(chǎn)業(yè)發(fā)展二十年,騰訊在過(guò)往的產(chǎn)業(yè)當(dāng)中二十年的情況,以及我們?cè)贏I上面的布局和考慮?,F(xiàn)在我來(lái)講一下整個(gè)AI,剛才講更多的是AI的希望,現(xiàn)在我來(lái)講一下AI方面的隱憂是什么。AI不是一個(gè)新的概念,發(fā)展了六十年,六十年AI一直都是有很多的起起落落,在去年突然一下大爆發(fā)了,一直延續(xù)到現(xiàn)在。像從五六年的會(huì)議開(kāi)始,AI就開(kāi)始有一個(gè)名詞,中間它經(jīng)過(guò)了很多起起落落,比較有名的,我相信大家知道,九十年代的IBM打敗了卡斯帕羅夫。IDM也有一款基于知識(shí)圖譜的知識(shí)問(wèn)答類(lèi)的,在危險(xiǎn)邊緣的挑戰(zhàn)賽里面取得了冠軍。大家可能記得最清楚的一件事情,可能還是去年AlphaGo打敗了世界冠軍,韓國(guó)的李世石,因?yàn)榇蠹叶颊J(rèn)為圍棋是在一個(gè)最古老的游戲里面,最復(fù)雜的游戲里面,在智能上面超過(guò)了人。當(dāng)然整個(gè)發(fā)展史里面也有很多技術(shù)方面的演進(jìn),比較有代表性的就是2006年,在學(xué)習(xí)上面真實(shí)的突破,他帶來(lái)了整個(gè)AR在發(fā)展方面極速的提升。
為什么這一次AI會(huì)讓大家這么大的這種期待,或者有這么大的關(guān)注呢?我覺(jué)得這是AI發(fā)展上面最主要的原因是這一次AI底層算法在深度學(xué)習(xí)上面進(jìn)行了有效突破,就是剛剛我說(shuō)的,所以使得這次AI的發(fā)展在2012年開(kāi)始,整個(gè)學(xué)習(xí)的方法,不像傳統(tǒng)的方法,讓人類(lèi)去模仿,就跟早期的人類(lèi)想學(xué)飛翔,原來(lái)的方法是粘上羽毛,像鳥(niǎo)一樣,真正的飛翔最后的原理是要通過(guò)空氣動(dòng)力學(xué)去解決飛鳥(niǎo)的原理,這就是深度學(xué)習(xí)的一個(gè)思想。之所以現(xiàn)在能在很多的這種工業(yè)上面,在很多應(yīng)用上面進(jìn)行突破,實(shí)際上本身是掌握了它的內(nèi)在的這種方法,而不是表面的方法,所以在這個(gè)上面,方法的研究方面我覺(jué)得是重要的。
第二個(gè)是模型上的提升,剛才我說(shuō)了,AI的發(fā)展有六十年,機(jī)器學(xué)習(xí)在八九十年代也非?;穑?dāng)時(shí)有一個(gè)叫SBM,它已經(jīng)是非常厲害的一種機(jī)器學(xué)習(xí)的算法。當(dāng)它達(dá)到幾億幾十億規(guī)模的時(shí)候,實(shí)際上它的計(jì)算能力就會(huì)急劇下降,做一個(gè)非常復(fù)雜的復(fù)合函數(shù)去描述這種方式,它通過(guò)DP多層連接,它達(dá)到一個(gè)指數(shù)層倍的關(guān)系,描述十億可能我們只需要三層一千個(gè)節(jié)點(diǎn)的連接,就能構(gòu)建十億個(gè)特征出來(lái)。所以從本身來(lái)講,模型上的提升這也是深度學(xué)習(xí)的突破。
另外一個(gè)東西在數(shù)學(xué)上面,就是EP上面問(wèn)題的解決,反向傳播的問(wèn)題。首先在數(shù)學(xué)理論上進(jìn)行,反向傳播是一個(gè)非常復(fù)雜的問(wèn)題,在神經(jīng)網(wǎng)絡(luò)里面當(dāng)一個(gè)東西在傳遞很多層網(wǎng)絡(luò)的時(shí)候,我們知道當(dāng)它往回我們要反向收斂的時(shí)候,我們都要去逼近最優(yōu)質(zhì),但是當(dāng)往往層數(shù)太多的時(shí)候,會(huì)發(fā)生一個(gè)梯度消失或者梯度膨脹的問(wèn)題,通過(guò)一些方法的解決,數(shù)學(xué)理論上面的解決,很好解決了這種問(wèn)題,所以在數(shù)學(xué)理論上面,建立了一個(gè)比較好的基礎(chǔ)。
正因?yàn)檫@三方面的優(yōu)勢(shì),所以使得在AI的浪潮里面,機(jī)器學(xué)習(xí)才會(huì)如此火。而且我堅(jiān)信這次浪潮會(huì)持續(xù)很遠(yuǎn)。右邊這幅圖就代表了在整個(gè)機(jī)器學(xué)習(xí)的一些圖文,在1933年到2000年左右,整個(gè)傳統(tǒng)的淺層機(jī)器學(xué)習(xí)的學(xué)習(xí)方法,它有一個(gè)比較好的下降過(guò)程,但是2000-2010年這十年,它進(jìn)展非???,它在方法上面,在模型上面可能都沒(méi)有進(jìn)行,突然在2012年左右,微軟研究院他們最開(kāi)始在工業(yè)界把機(jī)器學(xué)習(xí)用到語(yǔ)音識(shí)別里面去,取得了極大性的突破,急劇又進(jìn)行收斂,所以整個(gè)過(guò)程機(jī)器學(xué)習(xí)的能力的確是在過(guò)往的五年當(dāng)中,發(fā)展非常非??斓?。
講了很多機(jī)器學(xué)習(xí)的這種,剛剛說(shuō)的發(fā)展,快速的發(fā)展,它的方法也很好,模型也很好,數(shù)學(xué)算法也在突破,但是現(xiàn)狀是什么呢?就剛剛我說(shuō)的,今天我談的話題是AI期待很大,期待太大了,為什么會(huì)這么講?作為一個(gè)從業(yè)者,我對(duì)AI上面還是有很多很多的東西,可能是需要提出來(lái),就是這里面還是有很多的局限性。第一個(gè)就是本身深入學(xué)習(xí)的能力,就是我們說(shuō)的AI跟人去相比,它有多大的差距。實(shí)際上我們發(fā)現(xiàn)所有現(xiàn)在的機(jī)器學(xué)習(xí)的方法,我們都發(fā)現(xiàn)不管這個(gè)方法有多么的新提出來(lái),它的學(xué)習(xí)過(guò)程都是要從頭開(kāi)始學(xué),都要把數(shù)據(jù)重新進(jìn)行一次訓(xùn)練的過(guò)程。但這跟人的學(xué)習(xí)能力相比確實(shí)有很大的差距,人有很多的智能是與生俱來(lái)的,就像小孩剛出生,不需要多長(zhǎng)時(shí)間就知道這個(gè)世界是三維的,當(dāng)你把一個(gè)東西放在一個(gè),把一個(gè)瓶子放在電視機(jī)的后面,他是知道的,在電視機(jī)后面有一個(gè)東西的,這是一些特征是與生俱來(lái)的,這個(gè)是跟生物的進(jìn)化是相關(guān)的。所以人的這種,我們叫靈長(zhǎng)類(lèi)的動(dòng)物跟單細(xì)胞動(dòng)物相比,肯定是有與生俱來(lái)的能力。但是目前深度學(xué)習(xí)方法很遺憾,我們不管提出了多么優(yōu)秀的模型,可能我們都要重新開(kāi)始學(xué),這是第一個(gè)跟人的學(xué)習(xí)能力相比,這是一個(gè)非常大的缺陷。第二個(gè)就是我們不管有多么好的學(xué)習(xí)的,剛才說(shuō)有很多的模型,特別這幾年有非常多的出來(lái),不管有多么好的這種神經(jīng)網(wǎng)絡(luò)模型,它本質(zhì)上的問(wèn)題還是通過(guò)算力,計(jì)算能力去解決大數(shù)據(jù),更多的大數(shù)據(jù),更大的計(jì)算能力去做更好的融合的過(guò)程。過(guò)往是整個(gè)硬件發(fā)展,是順從了摩爾定律發(fā)展,發(fā)展非常之快,但是在未來(lái)的更多的參數(shù)下面,我們還有沒(méi)有這種能力,達(dá)到計(jì)算的效果,這要打上很大的問(wèn)號(hào)。
比如說(shuō)我們的網(wǎng)絡(luò)模型,2006年提出來(lái)的,到后面劍橋大學(xué)出來(lái)的,再到后面谷歌提出來(lái)的,再到2015年神經(jīng)網(wǎng)絡(luò),每一次新的模型提出都是把模型的層數(shù)加入更多,神經(jīng)單元更復(fù)雜,訓(xùn)練結(jié)果更長(zhǎng),得出來(lái)的結(jié)果也最優(yōu),但是本身這種方法是不是還能像原來(lái)的方法一樣可持續(xù),這要打一個(gè)很大的問(wèn)號(hào)。另外一個(gè)剛才解決的是圖像方面的問(wèn)題,下面我們解決感知的問(wèn)題,如果我們要解決認(rèn)知的問(wèn)題,那差距就更大了。人的語(yǔ)言是一個(gè)序列問(wèn)題,這個(gè)語(yǔ)言序列問(wèn)題如果要計(jì)算的話,這個(gè)算力是無(wú)論如何解決不了的。人可以很容易在對(duì)話當(dāng)中,回溯到一個(gè)很長(zhǎng)時(shí)間語(yǔ)句的某個(gè)片段的關(guān)鍵詞里面,但是在機(jī)器里面它卻不一定做到這個(gè),雖然我們也在最早的模型形成到現(xiàn)在長(zhǎng)短記憶單元的模型,到后面的我們現(xiàn)在騰訊的,帶有注意力的模型,但是總之來(lái)講,這種模型的演進(jìn)都還跟人相比是非常復(fù)雜的,是遠(yuǎn)不如人的。比如說(shuō)那天我看到一個(gè)對(duì)話,是三個(gè)人在對(duì)話,兩個(gè)人在聊,中間有大段聊去哪兒吃飯,突然有人問(wèn)太陽(yáng)呢?人知道這是描述太陽(yáng)隊(duì)的,因?yàn)榍懊婧茉缰坝腥嗽诹?,湖人跟快船的話題,突然來(lái)個(gè)太陽(yáng)大家就知道,但是機(jī)器基本上是沒(méi)辦法識(shí)別的。夏天能穿多少穿多少,冬天能穿多少穿多少,兩句基本上一樣,但是前面去描述,把少給突出來(lái)了,后面把冬天多顯出來(lái)。
第二個(gè)例子我講的是語(yǔ)音識(shí)別,我看了一個(gè)笑話,語(yǔ)音識(shí)別很難搞,您好,方便面試嗎?我在重復(fù)這句話的時(shí)候,我都不知道自己在講方便面是嗎,還是方便面是嗎,的確這是一個(gè)非常難的問(wèn)題,但是人的理念很多東西,是由于進(jìn)行反問(wèn)的時(shí)候,再慢慢把這個(gè)東西帶出來(lái)。所以說(shuō)目前的AI情況,在圖像里面,包括說(shuō)人臉做的多么多么厲害,99%,但實(shí)際上它在很多的約束條件下,它正臉,它不能側(cè)臉去做,就是完全側(cè)臉是完全不可能的,或者說(shuō)它戴帽子可能也比較難,所以它是在很多約束條件下面,達(dá)到了人臉識(shí)別,達(dá)到了9%,包括剛剛語(yǔ)音識(shí)別說(shuō)的,語(yǔ)音識(shí)別也是在很干凈的情況下,比如我們的噪音比較小,我們沒(méi)有風(fēng)噪,沒(méi)有車(chē)噪的問(wèn)題,可能機(jī)器在聽(tīng)語(yǔ)音識(shí)別的時(shí)候會(huì)識(shí)別出來(lái)一個(gè)比較好的效果,一旦距離遠(yuǎn)。但跟人相比,這完全不是問(wèn)題,包括多人的問(wèn)題,語(yǔ)音跟蹤的問(wèn)題,所以在我剛剛說(shuō)的感知的能力,它跟人基本的能力相比還差距很大,更別說(shuō)它在認(rèn)知方面,在LP這種語(yǔ)意方面。
所以在整個(gè)AI上面,隱憂我覺(jué)得是我們期待太好了,我們要回歸現(xiàn)實(shí),AI現(xiàn)在這個(gè)能力剛剛起來(lái),但是這個(gè)趨勢(shì)很好。未來(lái)AI發(fā)展方向是什么呢?我覺(jué)得AI跟人,包括機(jī)器學(xué)習(xí)跟人的能力上面有些差距,怎么去補(bǔ)齊差距呢?第一個(gè)我覺(jué)得跟人相比要?jiǎng)?chuàng)造,我們現(xiàn)在所有都是基于大數(shù)據(jù),這些數(shù)據(jù)從何而來(lái),這是非常重要的。這個(gè)數(shù)據(jù)現(xiàn)在是傳統(tǒng)的獲得而來(lái),但更多的數(shù)據(jù)是本身能創(chuàng)造出來(lái),當(dāng)然這條方法通過(guò)剛剛主持人介紹的,包括AlphaGo已經(jīng)在驗(yàn)證這樣的問(wèn)題,通過(guò)增強(qiáng)學(xué)習(xí)去產(chǎn)生人類(lèi)從未下過(guò)的棋,這是一種創(chuàng)造數(shù)據(jù)的能力,通過(guò)創(chuàng)造數(shù)據(jù)的能力產(chǎn)生更多的數(shù)據(jù),不一定是人創(chuàng)造了這些,去把這些東西更多的窮盡出來(lái),這是一種我覺(jué)得在未來(lái),如果在這方面發(fā)展的話,可能我們?cè)谠鰪?qiáng)學(xué)習(xí)方面,我們要進(jìn)行更多的發(fā)展和突破。第二個(gè)就是舉一反三,什么叫舉一反三,AlphaGo下圍棋能下倒世界冠軍,但是他的下棋方法到現(xiàn)在已經(jīng)不行了。因?yàn)樗姆椒ú⒉皇菫橄缕宥鴦?chuàng)造的,他不會(huì)進(jìn)行推導(dǎo)。當(dāng)我們驗(yàn)證大數(shù)據(jù)和一個(gè)非常好的效果的時(shí)候,我們數(shù)據(jù)量很小的時(shí)候,怎么把原來(lái)的模型遷移過(guò)來(lái),這是非常重要的研究方向。
第三個(gè)方向和人相比就是歸納總結(jié)。人是非常能進(jìn)行一些總結(jié)的,包括像牛頓的第一定律,包括牛頓的萬(wàn)有引力,都是人總結(jié)出來(lái)的,包括我們很多公理,但是目前機(jī)器學(xué)習(xí)是沒(méi)辦法進(jìn)行歸納總結(jié)的,我們之所以結(jié)果好,它并沒(méi)有提煉出公理和定律的關(guān)系。所以這方面未來(lái)我們要在歸納總結(jié),特別是無(wú)間度學(xué)習(xí)上面,分類(lèi)問(wèn)題是有目標(biāo)去學(xué)習(xí)的,但聚類(lèi)問(wèn)題沒(méi)有目標(biāo)的時(shí)候,我們?cè)趺窗阉酆谩K栽谶@三個(gè)能力上面,我相信這是我們未來(lái)在AI上面要進(jìn)行提升的。第二個(gè)就是在整個(gè)的發(fā)展方向上面,剛剛講了很多說(shuō)機(jī)器學(xué)習(xí)通過(guò)數(shù)據(jù)方法,它從傳統(tǒng)的淺層學(xué)習(xí)里面,我們所有的,通過(guò)統(tǒng)計(jì)學(xué)的概率論,完備的統(tǒng)計(jì)學(xué)概率論理論來(lái)支撐它,我們說(shuō)到求這種函數(shù)極限的問(wèn)題,我們有很多完備的數(shù)學(xué)公式去證明,我們一定能解決它的問(wèn)題,但是恰恰在我們機(jī)器學(xué)習(xí)上面,雖然前面我們用了隨機(jī)去找局部最優(yōu),但是它本身數(shù)學(xué)領(lǐng)域,它只是一個(gè)框架,我們?cè)诤芏嗌厦?,還是一個(gè)啟發(fā)式的約束,包括我們的初始化參數(shù)多少,包括我們學(xué)習(xí)率是多少,這都是有啟發(fā)性的。在未來(lái)如果機(jī)器學(xué)習(xí)要繼續(xù)往下走的話,我們?cè)跀?shù)學(xué)理論上面一定要有強(qiáng)大的支撐,特別傳統(tǒng)的機(jī)器學(xué)習(xí),數(shù)學(xué)完備型,要遷移到我們機(jī)器學(xué)習(xí)上來(lái)。
大家知道神經(jīng)網(wǎng)絡(luò)的提出,很多來(lái)自于原來(lái)的腦神經(jīng)學(xué)科和生物系統(tǒng),在本身這個(gè)上面,我相信未來(lái)AI的發(fā)展要引入更多,不光是我們數(shù)學(xué)學(xué)科,計(jì)算機(jī)學(xué)科,還要引入腦學(xué)科神經(jīng)去引,因?yàn)槟X的神經(jīng)結(jié)構(gòu)就是,剛剛我提到了蟬紗神經(jīng)網(wǎng),已經(jīng)連接腦神經(jīng)的概念了,進(jìn)行跨層連接,達(dá)到一個(gè)非常好的效果。當(dāng)然更多的東西我希望就是未來(lái),可能在交叉學(xué)科上面,包括剛剛說(shuō)的生物,腦神經(jīng),包括哲學(xué)都要去引進(jìn)來(lái),這樣的話整個(gè)AI可能才有更多完備型的發(fā)展。另外一個(gè)地方就是,在當(dāng)今世界里面,AI我覺(jué)得是對(duì)所有公司來(lái)講,對(duì)所有人來(lái)講都應(yīng)該是平等的,所以我們一定要開(kāi)放,比較好的是當(dāng)今世界所有的,在AI領(lǐng)域里面的大公司都在做,包括騰訊也會(huì),我們看到很多包括谷歌的Open,包括FaceBook它也Open了非常多的網(wǎng)絡(luò)模型,包括我們了解現(xiàn)在很火的OpenAI等等這些大的這種機(jī)器學(xué)習(xí),AI的這種先行者,騰訊在未來(lái)也會(huì)去進(jìn)行很多Open,把我們部分行為的數(shù)據(jù),就是這種環(huán)境,應(yīng)該是環(huán)境,讓更多的人來(lái)參與進(jìn)來(lái),進(jìn)行測(cè)試。所以整個(gè)過(guò)程就在未來(lái)AI的發(fā)展,我相信第一方面就是在能力上面,要跟人去匹敵的話,要進(jìn)行提升,第二個(gè)在整個(gè)學(xué)習(xí)的完備型,數(shù)學(xué)完備,學(xué)科完備上要進(jìn)行豐富,第三個(gè)就是所有的這種大的公司,AI的參與者,我們以更加開(kāi)放的心態(tài)去面對(duì)AI,這才是未來(lái)AI,AI的未來(lái)。
說(shuō)到這里我又要再次強(qiáng)調(diào)一下AI對(duì)騰訊來(lái)講非常重要,對(duì)中國(guó)整個(gè)互聯(lián)網(wǎng)都很重要。在當(dāng)今世界里面,曾經(jīng)我們可能在整個(gè)最開(kāi)始的互聯(lián)網(wǎng)時(shí)代,我們跟美國(guó)去比,可能還會(huì),美國(guó)最強(qiáng)的公司去比,可能還會(huì)有一些差距,包括我們?cè)瓉?lái)的工業(yè)時(shí)代,跟西方最強(qiáng)的發(fā)達(dá)領(lǐng)域,整個(gè)AI的時(shí)代我堅(jiān)信我們整個(gè)互聯(lián)網(wǎng)公司,包括騰訊上面,是跟世界一流的公司是有匹敵之處的,為什么?第一我們數(shù)據(jù)足夠多,中國(guó)的互聯(lián)網(wǎng)人數(shù)是其它國(guó)家可能互聯(lián)網(wǎng)人數(shù)的總和,中國(guó)的互聯(lián)網(wǎng)是世界上最大的互聯(lián)網(wǎng)總數(shù)的人數(shù),所以我們每天產(chǎn)生的數(shù)據(jù)足夠多,在騰訊里面,包括微信,包括QQ,產(chǎn)生了無(wú)數(shù)的數(shù)據(jù),我相信在中國(guó)其它的互聯(lián)網(wǎng)公司,包括我們的店商,包括我們的搜索也會(huì)產(chǎn)生很多的數(shù)據(jù),這對(duì)中國(guó)公司來(lái)講,這是非常好的一個(gè)優(yōu)勢(shì)。
第二是應(yīng)用場(chǎng)景,作為騰訊來(lái)講,我們有很多的這種把AI這種遙不可及的技術(shù)跟落地的機(jī)會(huì),我們可以在微信里面,在我們的游戲里面,在我們的新聞里面QQ里面去落地AI場(chǎng)景,哪怕小到一點(diǎn)語(yǔ)音識(shí)別,或者圖像,或者是說(shuō)聊天機(jī)器人等等,這都是我們可以去落地的地方。
第三個(gè)地方就是人才,人才是有數(shù)據(jù)統(tǒng)計(jì),目前的機(jī)器學(xué)習(xí)相當(dāng)一大部分人,雖然我們國(guó)內(nèi)人在機(jī)器學(xué)習(xí)上的專業(yè)還比較少,這個(gè)學(xué)科也比較少,但是在整個(gè)世界上來(lái)看,這個(gè)領(lǐng)域的華人是非常多的,我參加過(guò)2016年的ICML,有三千人,我敢說(shuō)大概3-40%人都是華人,那里面40%的文章都是華人寫(xiě)出來(lái)的。所以在這個(gè)上面,人才結(jié)構(gòu)上面我覺(jué)得中國(guó)是有非常好的這種人才的基礎(chǔ),說(shuō)正是基于我們數(shù)據(jù)的優(yōu)勢(shì),我們場(chǎng)景落地的優(yōu)勢(shì),我們?nèi)瞬沤Y(jié)構(gòu)的優(yōu)勢(shì),我覺(jué)得在騰訊也好,中國(guó)其它互聯(lián)網(wǎng)對(duì)AI的未來(lái)大有可為。最后講一下騰訊的AI使命。我們的AI使命,讓AI無(wú)所不在,謝謝大家。


-
傳奇歲月
-
原始傳奇
-
斗羅大陸(我唐三認(rèn)可0.1折)
-
妖神記之巔峰對(duì)決
-
無(wú)雙戰(zhàn)車(chē)(悟空沉默)
-
深淵契約
-
貓狩紀(jì)0.1折
-
靈劍仙師(斗破蒼穹)
玩家點(diǎn)評(píng) (0人參與,0條評(píng)論)
熱門(mén)評(píng)論
全部評(píng)論