科技日報北京7月14日電 (記者劉霞)據美國《新聞周刊》網站近日報導,美國科學家開發出一種新的人工智慧(AI)程序「合眾為一」(Pluribus),其在6人無限制德州撲克比賽中擊敗了6名全球頂尖選手。研究人員認為,這是人工智慧發展史上的一座裡程碑,未來有望應用於生物醫學、安全等領域。研究發表於12日出版的《科學》雜誌。
Pluribus由Facebook人工智慧實驗室和卡耐基梅隆大學的研究人員攜手完成。在遊戲中,Pluribus和職業選手共進行了10000手撲克牌比賽。在一種情況下,人工智慧面對5名人類選手;在另一種場景中,5個版本的人工智慧與一名人類選手對決(AI沒有相互配合)。研究人員發現,Pluribus的表現明顯優於人類。他們認為,這是「決定性的勝利」。
研究報告共同作者、卡內基梅隆大學計算機科學教授託馬斯桑德霍爾姆博士素有「德州撲克AI之父」的美譽,他表示:「在AI領域(至少自1970年以來)和博弈論領域(至少從1950年開始),撲克是測試非完美信息遊戲解決能力的主要基準。」
桑德霍爾姆解釋說,人工智慧已經在西洋棋、跳棋、圍棋、雙人限制和雙人無限制撲克等雙人零和遊戲中擊敗了人類。在雙人零和遊戲中,只能有一方可以獲勝,用博弈論的術語來講,這些人工智慧所做的都是在找到一個接近納什均衡的策略。所謂納什均衡策略就是指一系列能夠使自己預期收益最大化的策略。但由於六人遊戲規模大,人數多,上述辦法很難擴展到六人遊戲。
因此,研究人員需要找到一種方法來擺脫納什均衡,桑德霍爾姆解釋道:「這種策略計算起來要困難得多,但最新算法『強大且可擴展』,最新勝利『是AI在多玩家遊戲領域的第一個裡程碑』。」
桑德霍爾姆表示,這一研究所涉及的戰略推理技術未來有望在多個領域「大顯身手」,從撲克、視頻遊戲到投資銀行的戰略優化、政治運動等,不一而足,其還可以引導進化和生物學適應——例如醫療計劃和合成生物學等。此外,該技術還可用於電子戰、安全領域等。
總編輯圈點
谷歌的「阿爾法狗」在圍棋對弈中大敗李世石後,有人指出:別著急,人工智慧還沒打贏多人德州撲克呢。能在一對一的博弈中獲勝,確實是人工智慧的重要成就。不過,現實生活中很多競爭場景並非雙人對決,而是多人參與,股票投資、職位競選、招投標活動等等就是如此。因此人工智慧在6人德州撲克中獲勝,是一座新的裡程碑。在此基礎上,人工智慧有可望為多人競爭的更為複雜的現實場景,提供最優解決方案,從而勝任更多任務。