拳打AlphaLee,腳踢AlphaMaster,全新AlphaZero實(shí)現(xiàn)自我學(xué)習(xí)
據(jù)報道,《自然》雜志刊登了谷歌DeepMind團(tuán)隊的新成果,名為AlphaZero(暫譯:阿爾法元)的機(jī)器系統(tǒng)僅訓(xùn)練3天就戰(zhàn)勝了AlphaGo Lee,比分100:0,后者就是戰(zhàn)敗李世石的那套,經(jīng)過40天訓(xùn)練后,Alpha Zero又以89:11戰(zhàn)勝了Alpha Master,即橫掃柯潔的那套。
據(jù)介紹,更令人震驚的是,Alpha Zero的設(shè)計理念和系統(tǒng)配置完全和Lee/Master不同,它不依托于人類的先驗成果,完全靠自我對弈學(xué)習(xí)下棋。此前,Lee/Master都是用上千盤人類業(yè)余和專業(yè)棋手的棋譜進(jìn)行訓(xùn)練。同時,Zero僅配置了4個TPU,Lee則是48個谷歌TPU計算單元。
對于這一進(jìn)步,人類圍棋現(xiàn)世界第一柯潔以及前世界冠軍古力分別發(fā)表看法,柯潔稱:“一個純凈、純粹自我學(xué)習(xí)的alphago是最強(qiáng)的...對于alphago的自我進(jìn)步來講...人類太多余了。”
古力也慨嘆“20年不抵3天,我們的傷感,人類的進(jìn)步”,不知道大家如何看待呢。