人工智能戰(zhàn)勝職業(yè)撲克選手
最近幾年來(lái),人工智能獲得突飛猛進(jìn)的發(fā)展,在諸如國(guó)際象棋和圍棋等游戲中戰(zhàn)勝人類(lèi)。但是這些游戲都有一個(gè)共同點(diǎn),棋手的相關(guān)信息都能夠獲取。
最近,研究人員開(kāi)發(fā)了一個(gè)人工智能(AI)系統(tǒng),它在終極、無(wú)限德州撲克中戰(zhàn)勝了人類(lèi)。在幾周前,另一AI系統(tǒng)則在德州撲克單挑中戰(zhàn)勝了人類(lèi)。不同于圍棋,這種游戲難的多的原因是,每個(gè)玩家對(duì)可能的玩家有著不對(duì)稱(chēng)的信息。
人機(jī)對(duì)戰(zhàn)現(xiàn)場(chǎng)
近日,加拿大阿爾伯塔大學(xué)計(jì)算機(jī)的Matej Morav ík研發(fā)了一個(gè)被稱(chēng)為DeepStack的AI系統(tǒng),它在每3000次無(wú)限德州撲克比賽后,具有統(tǒng)計(jì)意義地打敗了11名職業(yè)撲克選手中的10名(第11名選手也被打敗,但是不具備統(tǒng)計(jì)學(xué)顯著意義)。
人機(jī)對(duì)戰(zhàn)現(xiàn)場(chǎng)
研究人員表示,在游戲的每個(gè)時(shí)間點(diǎn),DeepStack會(huì)重新計(jì)算游戲策略,而不是將可能玩法計(jì)算到最后,它對(duì)允許進(jìn)行的玩法深度和類(lèi)型做了限制。這將可能的決策點(diǎn)從超過(guò)10的160次方個(gè)減少到大約10的7次方個(gè),DeepStack的電腦芯片可能在5s鐘內(nèi)完成決策。
圖片來(lái)源于網(wǎng)絡(luò)
具有意義的事,這種AI系統(tǒng)將有助于解決涉及信息不對(duì)稱(chēng)的現(xiàn)實(shí)世界問(wèn)題,例如捍衛(wèi)戰(zhàn)略資源和做出重要的醫(yī)療建設(shè)等。