OpenAI可以宣布自己是世界第一了
OpenAIFive在Dota2中以2:0擊敗了世界冠軍團(tuán)隊(duì),人機(jī)大戰(zhàn)人類最終不敵AI。OpenAIFive在去年輸?shù)舯荣惡筮M(jìn)行了優(yōu)化,訓(xùn)練時(shí)間相當(dāng)于人類玩了4.5萬(wàn)年。
OpenAI可以宣布自己是世界第一了。
今天凌晨,OpenAIFive在Dota2中以2:0擊敗了世界冠軍團(tuán)隊(duì)OG,再次顯示出了AI的強(qiáng)大威力,也正式宣告人類在Dota這種高難度游戲中成為AI的手下敗將。
這次比賽,OpenAIFive的表現(xiàn)出是迄今為止展示出的最高水平:人類對(duì)手去年贏得了世界上最令人垂涎的電子競(jìng)技賽事TI8的冠軍;OpenAIFive在去年輸?shù)舯荣惡筮M(jìn)行了優(yōu)化,訓(xùn)練時(shí)間相當(dāng)于人類玩了4.5萬(wàn)年,贏得比賽也并不出乎意料。
人類對(duì)手OG團(tuán)隊(duì)
2:0,AI戰(zhàn)勝人類
在這場(chǎng)人機(jī)大戰(zhàn)中,每隊(duì)只有17個(gè)英雄可供選擇。OpenAI還選擇了所謂的“Captain'sDraft”游戲模式。與之前的比賽一樣,OpenAI也禁用了召喚和幻覺(jué)功能,這兩項(xiàng)功能都涉及以英雄副本的形式引入其他變量,以及OpenAI訓(xùn)練系統(tǒng)時(shí)未考慮的一些特殊因素和單位。
除此之外,這場(chǎng)比賽與正常的Dota2比賽一樣,其最終目標(biāo)是摧毀敵方隊(duì)伍的“基地”,即每個(gè)團(tuán)隊(duì)領(lǐng)土末端的大型塔樓,在敵人的隊(duì)伍成功摧毀其他小型塔后,基地是很脆弱的,整個(gè)比賽過(guò)程的中心是對(duì)塔的攻防,以及英雄與英雄之間的團(tuán)戰(zhàn)。
在第一場(chǎng)比賽中,OpenAIFive讓對(duì)手OG大吃一驚,通過(guò)一系列激進(jìn)戰(zhàn)術(shù)獲得了勝利,其中包括對(duì)游戲中獲取的金幣的花費(fèi)方式,在本方英雄死亡時(shí)立即買活,即使在比賽初期也是如此。
對(duì)此,OpenAI首席技術(shù)官GregBrockman指出,OpenAI喜歡有利于短期收益的戰(zhàn)略,說(shuō)明在長(zhǎng)期規(guī)劃上不如人類,而且DOTA2這種游戲通常要依賴于長(zhǎng)期規(guī)劃才能獲勝。然而,在這場(chǎng)比賽中,這種早期的買活策略得到了回報(bào),OpenAIFive獲得了優(yōu)勢(shì),當(dāng)比賽拖入30分鐘時(shí),OG頂不住了。
在第二場(chǎng)比賽中,OpenAI表現(xiàn)更好,在最初的幾分鐘內(nèi)即獲得了對(duì)OG的早期優(yōu)勢(shì),然后無(wú)情碾壓了人類玩家,在第一場(chǎng)比賽時(shí)間剛剛過(guò)半的時(shí)間點(diǎn)上即取得勝利。
值得注意的是,OpenAIFive在第二場(chǎng)比賽中開(kāi)始玩得異常激進(jìn),以及OG在AI全圖范圍內(nèi)的推進(jìn)時(shí)有些無(wú)力對(duì)抗。OpenAIFive能夠利用其特定的英雄選擇帶來(lái)的優(yōu)勢(shì)。
飛速進(jìn)化的OpenAIFive:已經(jīng)訓(xùn)練4.5萬(wàn)年
去年8月,OpenAIFive曾以3:2擊敗半職業(yè)人類玩家,不過(guò)當(dāng)面對(duì)職業(yè)對(duì)手時(shí),OpenAI便輸給了paiNGaming戰(zhàn)隊(duì),帥不過(guò)三秒。
根據(jù)OpenAI聯(lián)合創(chuàng)始人兼主席GregBrockman(也是該組織的CTO)的說(shuō)法,在輸?shù)舯荣愔?,OpenAIFive是通過(guò)在加速的虛擬環(huán)境中進(jìn)行自我改進(jìn)而變得更加強(qiáng)大的。
OpenAIFive由深度強(qiáng)化學(xué)習(xí)提供支持,也就是說(shuō)它的編碼目的不是“如何游戲”,而是“如何學(xué)習(xí)”。Brockman在比賽開(kāi)始前表示。,AI在10個(gè)月中,已經(jīng)玩了45000年的Dota2游戲,而且,玩了這么長(zhǎng)時(shí)間也沒(méi)有覺(jué)得無(wú)聊。
這場(chǎng)比賽采用三局兩勝制,所有bot都使用相同的深度強(qiáng)化學(xué)習(xí)技術(shù)進(jìn)行訓(xùn)練,并由同一OpenAI系統(tǒng)的不同層獨(dú)立控制。
OpenAI向公眾開(kāi)放與AI對(duì)決,終極目標(biāo)是實(shí)現(xiàn)通用人工智能
對(duì)于OpenAI來(lái)說(shuō),值得慶祝的不僅僅是這次勝利,還因?yàn)槠渥C明了對(duì)強(qiáng)化學(xué)習(xí)的態(tài)度及其關(guān)于AI的普適哲學(xué)樹(shù)立的里程碑。
研究團(tuán)隊(duì)將不再公開(kāi)展示其AI游戲bot,而是致力于開(kāi)發(fā)軟件,讓人類與OpenAIFive軟件實(shí)時(shí)協(xié)作,與機(jī)器人一起玩游戲,并學(xué)習(xí)他們獨(dú)特的前所未有的戰(zhàn)略和行為。
OpenAIFive還發(fā)布了一個(gè)平臺(tái),供公眾與OpenAIFive對(duì)戰(zhàn),這種模式稱為“競(jìng)技場(chǎng)”模式,將于4月18日起開(kāi)放三天。OpenAI表示,協(xié)作軟件可能永遠(yuǎn)不會(huì)向公眾開(kāi)放,不過(guò)大家可以在活動(dòng)中親自嘗試一下。
OpenAI的聯(lián)合創(chuàng)始人兼首席執(zhí)行官SamAltman還表示,此類工作證明了與AI智能體的合作可能會(huì)在未來(lái)帶來(lái)巨大的利益。
Altman說(shuō):“對(duì)于世界如何運(yùn)作,如何訓(xùn)練這些智能體,令其實(shí)現(xiàn)協(xié)作上,這次活動(dòng)是重要的一課。實(shí)現(xiàn)人類與AI的合作,是我們對(duì)未來(lái)世界更積極的愿景之一,人工智能與人類共同努力,使人類變得更好、更有趣、更有影響力?!?/p>
OpenAI可能會(huì)繼續(xù)涉足Dota2和其他視頻游戲,主要是因?yàn)檫@些游戲是人工智能的良好測(cè)試平臺(tái),也是衡量AI技術(shù)進(jìn)步的良好基準(zhǔn)測(cè)試工具。
現(xiàn)在可能還沒(méi)有一個(gè)游戲像OpenAIFive這樣,AI系統(tǒng)最終無(wú)法具備超出人類能力的水平。對(duì)于更廣泛的AI行業(yè)而言,精通視頻游戲可能很快就會(huì)變得過(guò)時(shí),我們需要簡(jiǎn)單的方式來(lái)證明AI系統(tǒng)可以快速學(xué)習(xí),并能夠更快速高效地的解決現(xiàn)實(shí)世界的困難任務(wù),獲得更有意義的好處。
最終,OpenAI希望將其Dota2學(xué)習(xí)并擴(kuò)展到游戲之外的新領(lǐng)域,并最終擴(kuò)展到現(xiàn)實(shí)世界中。為此,OpenAI正致力于使用強(qiáng)化學(xué)習(xí)和其他技術(shù),為機(jī)器人手提供更靈巧、更精細(xì)、更人性化的動(dòng)作。
“OpenAI正在努力的方向建立通用人工智能(AGI),并與世界分享這些好處,同時(shí)確保其安全性?!盇ltman說(shuō)的是建立一個(gè)能夠執(zhí)行任何人類任務(wù)的多功能AI系統(tǒng)?!拔覀兊哪繕?biāo)不是戰(zhàn)勝電子游戲,雖然這很有趣。我們的目標(biāo)是揭開(kāi)實(shí)現(xiàn)AGI道路上的秘密?!?/p>