柯潔“約戰(zhàn)”AlphaGo:我抱著必勝的信念!
雖然AlphaGo給我們帶來(lái)了極大的震撼,但也不是不可戰(zhàn)勝的。我抱著必勝的信念而來(lái),絕不會(huì)說(shuō)人機(jī)大戰(zhàn)勝負(fù)無(wú)所謂這樣的話,我會(huì)全力以赴,爭(zhēng)取打破AlphaGo的不敗戰(zhàn)績(jī)!”4月10日,20歲的圍棋天才,被認(rèn)為當(dāng)今全球人類圍棋第一人的柯潔九段在新聞發(fā)布會(huì)上說(shuō)。
柯潔(右一)。
近日,中國(guó)圍棋協(xié)會(huì)與浙江省體育局共同舉辦新聞發(fā)布會(huì)宣布,5月23日至27日將在烏鎮(zhèn)舉辦“中國(guó)烏鎮(zhèn)·圍棋峰會(huì)”。屆時(shí)AlphaGo將與中國(guó)頂尖棋手以及來(lái)自人工智能界的專家齊聚一堂,共同探索圍棋與人工智能背后的深遠(yuǎn)奧秘。
一年前,世人共同見(jiàn)證了人工智能領(lǐng)域的一個(gè)重大里程碑: AlphaGo戰(zhàn)勝了傳奇圍棋選手李世石。
事實(shí)上,人工智能的加入并沒(méi)有像一些人所擔(dān)心的那樣使這項(xiàng)游戲式微,反而讓人類棋手變得更加強(qiáng)大而富有創(chuàng)造力。盡管圍棋可能是歷史上被研究、推敲得最為透徹的一項(xiàng)游戲,許多職業(yè)棋手以及業(yè)余愛(ài)好者仍然是通過(guò)對(duì)AlphaGo創(chuàng)新著法的深入研究,學(xué)到了嶄新的知識(shí)和策略。
“AlphaGo下棋讓人感覺(jué)更自由一些,沒(méi)有什么著法是完全不能下的。現(xiàn)在大家都更多地在嘗試以前沒(méi)有下過(guò)的一些下法。”周睿羊九段曾表示。
圖為:柯潔(最右)與聶衛(wèi)平(右二),樊麾(站立者)和古力(最左)于去年在北京聶衛(wèi)平圍棋道場(chǎng),憑記憶復(fù)盤(pán) AlphaGo與李世石第一局的開(kāi)局。
此次“中國(guó)烏鎮(zhèn)·圍棋峰會(huì)”旨在通過(guò)頂尖人類棋手與極具創(chuàng)造性的人工智能對(duì)手之間的合作,使人們得到關(guān)于圍棋和人工智能的更多新啟示。
據(jù)主辦方介紹,此次峰會(huì)特別設(shè)計(jì)了AlphaGo與中國(guó)頂尖棋手的三種比賽形式,具體包括:首先,人機(jī)配對(duì)賽:中國(guó)職業(yè)棋手將與另一名職業(yè)棋手對(duì)弈。每一方棋手都將有AlphaGo作為自己的隊(duì)友與他們交替落子,真正體現(xiàn)共同學(xué)習(xí)的真諦。
其次,團(tuán)隊(duì)賽:由五位中國(guó)頂尖棋手組隊(duì)與 AlphaGo進(jìn)行對(duì)弈,共同測(cè)試 AlphaGo在面對(duì)組合風(fēng)格時(shí)所展現(xiàn)的創(chuàng)造力和適應(yīng)性。
第三,柯潔對(duì)陣 AlphaGo:AlphaGo 與世界排名第一的棋手柯潔進(jìn)行的三番棋對(duì)弈將成為萬(wàn)眾所矚目的焦點(diǎn)??聺崟?huì)將 AlphaGo的能力推向甚至超越極限。
柯潔是金立智能手機(jī)的品牌文化大使。金立認(rèn)為,圍棋,并不在于計(jì)較一子一目的得失,更需要放眼全局的取舍和戰(zhàn)略,是一種長(zhǎng)距離的“超級(jí)續(xù)航”般的較量。圍棋表達(dá)了一種靜默的思考,充滿了寵辱不驚的氣度,是人類智慧的杰作。圍棋人工智能的最高水平與人類最高水平之間的對(duì)決,比賽本身的意義就已非同凡響。人工智能代表著科技的未來(lái),也是人類的未來(lái),人機(jī)之戰(zhàn),是人類智慧的延伸,是人類對(duì)極限、對(duì)未來(lái)的一次勇敢探索。金立支持柯潔勇戰(zhàn)AlphaGo。
除動(dòng)人心魄的比賽之外,峰會(huì)還將舉辦一場(chǎng)有關(guān)人工智能未來(lái)的論壇。來(lái)自人工智能的頂尖專家將共同探索AlphaGo如何為圍棋這項(xiàng)古老的游戲帶來(lái)了全新的認(rèn)知,并進(jìn)一步探討人工智能與機(jī)器學(xué)習(xí)是如何幫助人類為世界上一些重大難題帶來(lái)解決方案。
據(jù)介紹,AlphaGo背后的部分機(jī)器學(xué)習(xí)方法已經(jīng)被應(yīng)用到實(shí)際生活中,并在一些重大問(wèn)題中發(fā)揮了作用,比如減少能源使用。機(jī)器學(xué)習(xí)技術(shù)也已經(jīng)開(kāi)始應(yīng)用于一系列醫(yī)療研究項(xiàng)目中。
延伸閱讀
AlphaGo是什么?
AlphaGo 是第一個(gè)擊敗人類職業(yè)圍棋選手、第一個(gè)戰(zhàn)勝世界冠軍的電子計(jì)算機(jī)程序,是圍棋史上最具實(shí)力的選手之一。2016 年 3 月,在全世界超過(guò)一億觀眾的關(guān)注下,AlphaGo經(jīng)過(guò)5局對(duì)弈,最終以 4 比 1 的總比分戰(zhàn)勝了圍棋世界冠軍李世石,這場(chǎng)比賽成為了人工智能領(lǐng)域的一個(gè)重要里程碑。過(guò)去曾有專家預(yù)測(cè),人工智能需要十年的時(shí)間才可能戰(zhàn)勝人類職業(yè)選手,在這場(chǎng)比賽后,AlphaGo憑借其“充滿創(chuàng)意而又機(jī)智”的下法,躋身圍棋界最高職業(yè)稱號(hào)——職業(yè)九段行列,成為歷史上首個(gè)獲得這一榮譽(yù)的非人類棋手。 近期,AlphaGo的升級(jí)版本以"Master / Magister"的稱謂與世界頂級(jí)的圍棋選手進(jìn)行了60場(chǎng)線上快棋賽,并取得了全勝的出色戰(zhàn)績(jī)。
AlphaGo如何訓(xùn)練?
一直以來(lái),圍棋就被認(rèn)為是傳統(tǒng)游戲中,對(duì)人工智能而言最具挑戰(zhàn)性的項(xiàng)目。這不僅是因?yàn)閲灏她嫶蟮乃阉骺臻g,更是因?yàn)閷?duì)于落子位置的評(píng)估難度已遠(yuǎn)遠(yuǎn)超過(guò)了簡(jiǎn)單的啟發(fā)式算法。 為應(yīng)對(duì)圍棋的復(fù)雜性,AlphaGo采用了一種新穎的機(jī)器學(xué)習(xí)技術(shù),結(jié)合了監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的優(yōu)勢(shì)。通過(guò)訓(xùn)練形成一個(gè)策略網(wǎng)絡(luò)(policy network),將棋盤(pán)上的局勢(shì)作為輸入信息,并對(duì)所有可行的落子位置生成一個(gè)概率分布。然后,訓(xùn)練出一個(gè)價(jià)值網(wǎng)絡(luò)(value network)對(duì)自我對(duì)弈進(jìn)行預(yù)測(cè),以 -1(對(duì)手的絕對(duì)勝利)到1(AlphaGo的絕對(duì)勝利)的標(biāo)準(zhǔn),預(yù)測(cè)所有可行落子位置的結(jié)果。這兩個(gè)網(wǎng)絡(luò)自身都十分強(qiáng)大,而 AlphaGo將這兩種網(wǎng)絡(luò)整合進(jìn)基于概率的蒙特卡羅樹(shù)搜索(MCTS)中,實(shí)現(xiàn)了它真正的優(yōu)勢(shì)。最后,新版的AlphaGo 產(chǎn)生大量自我對(duì)弈棋局,為下一代版本提供了訓(xùn)練數(shù)據(jù),此過(guò)程循環(huán)往復(fù)。
AlphaGo 如何決定落子?
在獲取棋局信息后,AlphaGo 會(huì)根據(jù)策略網(wǎng)絡(luò)(policy network)探索哪個(gè)位置同時(shí)具備高潛在價(jià)值和高可能性,進(jìn)而決定最佳落子位置。在分配的搜索時(shí)間結(jié)束時(shí),模擬過(guò)程中被系統(tǒng)最頻繁考察的位置將成為 AlphaGo 的最終選擇。在經(jīng)過(guò)先期的全盤(pán)探索和過(guò)程中對(duì)最佳落子的不斷揣摩后,AlphaGo的搜索算法就能在其計(jì)算能力之上加入近似人類的直覺(jué)判斷。